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1. Kapitel 



Modelle zur Beschreibung 
statistischer Zusammenhange in 
der psychologischen Forschung 

Helfried M oosbrugger 
1. Einfuhrung und Oberblick 

In diesem Kapitel geben wir eine Einfuhrung in Bereiche der angewandten 
Statistik, die bereits um die Jahrhundertwende betreten wurden (siehe z.B. 
Pearson 1896, Spearman 1904), aber bis heute in einer intensiven Entwicklung 
stehen, deren Ende noch nicht abzusehen ist. Wir behandeln in Form eines 
integrierenden Uberblicks Theorie und Anwendung von Modellen zur Be- 
schreibung statistischer Zusammenhange. 

Beobachtung und Beschreibung von Zusammenhangen haben in der psycholo- 
gischen Forschung zumindest zwei Funktionen: zum einen entsteht dadurch 
ein AnlaB, induktiv die Entwicklung inhaltlicher Theorien zu betreiben, weil 
beobachtete statistische Zusammenhange einer theoretischen Erklarung bedttr- 
fen; zum anderen sind beobachtete statistische Zusammenhange gewisserma- 
Ben die empirischen Gegebenheiten, an denen deduktiv die Theorien auf ihre 
Gultigkeit hin uberprilft werden. Oft sind dabei die empirischen Beobachtun- 
gen selbst schon auf theoretische Vorannahmen gegrlindet: Stellt man bei- 
spielsweise bei einer empirischen Untersuchung eine Korrelation zwischen 
,,Intelligenz“ und ,,Schulleistung“ fest, so hat man vorher implizit im Sinne 
von Spearman (1904, 1926) die theoretische Entscheidung getroffen, daB ,,In- 
telligenz" eine einheitliche latente Variable sei. die mit einem psychometri- 
schen Test gemessen werden kann. Dieses Vorgehen ist keineswegs unstrittig, 
weil von anderen Autoren (z.B. Thurstone 1938, Guilford 1967) in Frage 
gestellt wird, daB es sich bei Intelligenz um eine einheitliche Eigenschaft hand- 
le, welche mit dem Intelligenzquotienten als Kennzahl darstellbar ist. Entspre- 
chendes gilt auch fur „Schulleistung“. Unter diesem Blickwinkel mttssen selbst 
,,empirische“ beobachtete Zusammenhange bereits als ,,theoriebehaftet“ (vgl. 
dazu auch Holzkamp, 1972. S. 81) angesehen werden. 
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Wahrend wir uns im folgenden Abschnitt mit Modellen befassen, welche die 
statistischen Zusammenhange manifester, d.h. direkt beobachtbarer Variablen 
beschreiben, beschaftigen wir uns im darauffolgenden Abschnitt mit Situatio- 
nen, in denen beobachtbare Zusammenhange von manifesten Variablen auf 
nicht direkt beobachtbare ,,latente“ Variablen zuruckgefuhrt werden. Solche 
latenten Variablen sind hiiufig Begriffe, welche in psychologischen Theorien 
verwendet werden. ,.lntelligenz“ z.B. kann nicht als direkt beobachtbar aufge- 
faBt werden. Beobachtbar sind vielmehr nur Verhaltensweisen, die auf unter- 
schiedliche Auspragung der Intelligenz schlieBen lassen. Ebenso verhiilt es sich 
mit anderen ,,Personlichkeitseigenschaften“. Daher geben wir im dritten Ab- 
schnitt eine Einfuhrung in die wesentlichen Grundgedanken der Theorie laten- 
ter Variablen, welche insofern die formale Grundlage vieler psychologischer 
Begriffe bildet, als sie angibt, wie latente Eigenschaften mit beobachtbarem 
Verhalten verknupft werden konnen. Exemplarisch behandeln wir den Fall 
einer latenten Variablen, welche die Abhangigkeiten zwischen den beobacht- 
baren Variablen erklart in dem Sinn, daB deren Abhangigkeiten verschwinden, 
wenn die gemeinsame latente Variable auf einem festen Wert gehalten wird. 
Beobachtete Variablen mit dieser Eigenschaft heiBen kongenerisch (Joreskog, 
1971, Steyer & Moosbrugger, 1979). 

Die formale Gemeinsamkeit aller in diesem Kapitel behandelten statistischen 
Modelle besteht darin, daB sie alle mit dem Konzept der bedingten Erwartung 
formuliert werden konnen, fill' die im Anhang C einige Rechenregeln zusam- 
mengestellt sind. Die bedingte Erwartung E(y |x) beispielsweise ist eine sto- 
chastische Variable oder Zufalls variable 1 ’, deren Werte E(y \ x—x ) die Erwar- 
tungswerte der abhangigen stochastischen Variablen y unter der Bedingung 
sind, daB die ,,bedingende“ Variable x einen bestimmten Wert x angenommen 
hat. Im Grunde beschreiben die hier behandelten Modelle immer nur in einer 
mathematischen Formulierung unsere Vorstellung, welche Werte der Varia- 
blen y bei gegebenen Werten der Variablen x zu erwarten sind. Diese einfache 
Grundidee kann zu recht komplizierten Modellen mit mehreren x- und y- 
Variablen ausgebaut werden. 

Im Abschnitt 2 dieses Kapitels stellen wir statistische Modelle mit manifesten 
Variablen dar, die alle mit der Gleichung 

(1.1) E(y\x l ,x 2 ,...,x Q ) = (3 0 + P, x, + (3 2 x 2 + ... + |3 q x Q 

formuliert werden konnen, wobei y sowie die x q , q 6 {1,2, . . ., Q} stochasti- 
sche Variablen und die Parameter |3 0 und |3 q reellwertige Konstanten sind. Statt 

') Wir gebrauchen ..stochastische Variable" synonym zu „Zufallsvariable“ (auf dem 
Wahrscheinlichkeitsraum (Q,^?,P)), worunter man eine ^-mefibare Abbildung von Q 
nach IR, der Menge der reellen Zahlen versteht, wobei Q die Menge der Elementarer- 
eignisse, ^ 4 die (Ereignis-)o- Algebra und P ein WahrscheinlichkeitsmaB ist (vgl. Bauer, 
1974, s. 137). 
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E(y | Xj,x 2 , . . . ,Xq) schreiben wir auch E(y\x) mit dem Q-variaten stochasti- 
schen Vektor 2 ) x = (x u x 2 , . . .,Xq). 

Wie wir zeigen werden, liegt Gleichung 1.1 einer Reihe von Analyseverfahren 
zugrunde, welche sich nur hinsichtlich der Skalenqualitat der beteiligten Varia- 
blen unterscheiden: In der Regressionsanalyse sind sowohl y als auch die x q 
quantitative Variablen, und E(y Ixr) ist somit die Regressionsgerade, -ebene 
oder -hyperebene, je nachdem, wie viele Variablen in x zusammengefafit sind. 
In der Varianzanalyse ist y quantitativ, aber die x q sind qualitative zweistufige 
Indikatorvariablen, welche die Gruppenzugehorigkeit anzeigen; die Werte 
von E(y |x) sind dann Erwartungs werte der abhangigen Variablen in den 
Gruppen. In der Diskriminanzanalyse mit zwei Gruppen ist y eine Indikator- 
variable fur die Gruppenzugehorigkeit, wohingegen die x q quantitativ, aber 
auf ein bestimmtes Intervall beschrankt sind, wenn man auch dort die Glei- 
chung 1.1 zugrunde legt. Kodiert man die Zugehorigkeit zu den beiden Grup- 
pen mit Null und Eins, so hat E(y |x) die bedingten Wahrscheinlichkeiten 
P(y— 1 | x=x) als Werte, namlich die Wahrscheinlichkeiten bei gegebenen 
Werten der Variablen x q , der Gruppe ,,1“ anzugehoren. 

In der Kontingenzanalyse schlieBlich sind sowohl y als auch x q qualitative 
Indikatorvariablen, und die Kodierung von y mit Null und Eins ftihrt wieder 
dazu, daB E(y |x) bedingte Wahrscheinlichkeiten als Werte enthalt, aber dies- 
mal unter einer Gruppenzugehorigkeit und nicht, wie bei der Diskriminanz- 
analyse, unter der Auspragung quantitativer Variablen x q . 

Man kann schon hier erkennen, daB alle genannten Verfahren auf der gleichen 
Modellannahme basieren und sich lediglich durch das Skalenniveau der betei- 
ligten Variablen unterscheiden. 

Im Abschnitt 3 behandeln wir ebenfalls Modelle, denen eine Gleichung der 
Form der Gleichung 1.1 zugrundeliegt, jedoch handelt es sich dort bei der 
unabhangigen bedingenden Variablen nicht um eine direkt beobachtbare, son- 
dern um eine latente Variable, die wir mit dem kleinen griechischen Buchsta- 
ben 5 bezeichnen. Der Ubersichtlichkeit halber beschranken wir uns in jenem 
dritten Abschnitt auf eine latente Variable. Daflir ist es aber notwendig, zu- 
gleich mehrere abhangige Variablen y p zu betrachten. Den meisten Modellen 
jenes Abschnitts liegt die Gleichung 

(1.2) E(y v U) = kp 0 + p € {1,2 P} 

zugrunde, wobei k p0 wiederum eine reellwertige Skalenkonstante ist und \ p ein 
reellwertiger Parameter, der ebenso wie die Konstanten |5 q (siehe Gleichung 
1.1) die Enge des statistischen Zusammenhangs zwischen den betreffenden 
Variablen angibt. 

2 ) Ein Q-variater stochastischer Vektor (oder Zufallsvektor) ist eine d-meBbare Abbil- 
dung von Q nach IR Q (vgl. auch FuBnote 1). 
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Nach der Entwicklung einer allgemeinen Theorie latenter Variablen werden 
wir zeigen, daB auch Gleichung 1.2 verschiedenen, eng miteinander verwand- 
ten Modellen mit latenten Variablen zugrunde liegt, welche sich nur dadurch 
unterscheiden, daB die beteiligten Variablen quantitativ bzw. qualitativ sind: 
In der Faktorenanalyse mit einem Faktor, welche formal als Analogon zur 
Regressionsanalyse aufgefaBt werden kann. sind sowohl die y p als auch £ quan- 
titativ, und E(y p \^) entspricht einer Regressionsgeraden. Sind die y P wieder 
Indikatorvariablen fur jeweils zwei Gruppen, wohingegen ^ quantitativ, aber 
auf ein bestimmtes Intervall beschrankt ist, so erhalten wir Lazarsfeld's ,, linear 
traceline model", wobei E(y p \t;) die ,,traceline“ bezeichnet und wieder bedingte 
Wahrscheinlichkeiten P(y p — 1 [§=?;) als Werte aufweist, wenn man als Kodie- 
rung filr die y P Null und Eins wahlt. In formaler Hinsicht entspricht dieses 
Modell daher der Diskriminanzanalyse. Sind die y P quantitativ und ist £ eine 
Variable, welche die Zugehorigkeit zu einer von zwei latenten Gruppen an- 
zeigt, so erhalten wir Gibsons ,, latent profile model". Die bedingte Erwartung 
E{y p \%) enthalt dabei die Erwartungswerte der y P innerhalb der jeweiligen la- 
tenten Gruppe. Formal ist dieses Modell analog zur Varianzanalyse. Sind 
schlieBlich alle beteiligten Variablen qualitativ mit der Kodierung Null und 
Eins, so finden wir, daB Gleichung 1.2 das ,, latent class model “ von Lazarsfeld 
beschreibt, und £(jy p j^)iat wieder die bedingten Wahrscheinlichkeiten 
P{y p —\\^, = als Werte. Dieses Modell entspricht also in formaler Hinsicht 
die Kontingenzanalyse. Auch ,,logistische Testmodelle“ wie z.B. das ..Rascli- 
Modell", und das ,,klassische latent-additive TestmodeH" von Moosbrugger & 
Muller, welche keine unmittelbare Entsprechung bei den Modellen mit mani- 
festen Variablen haben, werden wir als Anwendungsfalle der Theorie latenter 
Variablen referieren. 

Bei alien Gemeinsamkeiten, die in formaler Hinsicht zwischen den Modellen 
der zweiten und denjenigen des dritten Abschnitts bestehen, darf man jedoch 
nicht die Unterschiedlichkeit iibersehen, die in ihren Zielen bestehen. Wah- 
rend die Modelle des zweiten Abschnitts den Zweck haben, statistische Zu- 
sammenhange zu beschreiben, dienen die Modelle des dritten Abschnitts ge- 
wissermaBen der Bildung von psychologischen Begriffen. Die jeweiligen laten- 
ten Variablen £ lassen sich namlich als psychologische Konstrukte (s. z.B. 
Herrmann, 1973 oder MacCorquodale & Meehl, 1948) interpretieren. 

Die Modelle latenter Variablen konnen als eine Art der Erklarung von statisti- 
schen Zusammenhangen aufgefaBt werden, da die Zusammenhange zwischen 
den abhangigen Variablen y P , sofern sie ,,kongenerisch“ sind. bei jeder Auspra- 
gung von £ verschwinden. In diesem Sinn kann man sagen, daB die latente 
Variable £ dem Modell nach die statistischen Abhangigkeiten zwischen den 
beobachtbaren Variablen y P erklart. Eine grundlegende Behandlung von Mo- 
dellen zur Erklarung statistischer Zusammenhange nimmt Steyer (1982) in 
diesem Band vor. 
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2. Modelle mit manifesten Variablen 
2.1 Einleitung und Uberblick 

Im vorliegenden Abschnitt 2 behandeln wir die Regressions-, Varianz-, Dis- 
kriminanz- und Kontingenzanalyse. Dabei zeigen wir, daB die Analyseverfah- 
ren in formaler Hinsicht grundlegende Gemeinsamkeiten aufweisen. Die ver- 
schiedenen Namen dieser Verfahren sind eher historisch zu verstehen, ebenso 
wie ihre getrennte Behandlung in den Lehrbiichern der angewandten Statistik. 
Die Worte ,,Varianz-“, Regressionsanalyse“ etc. sind eher als Kennzeichnung 
fiir die Fragestellungen aufzufassen, bei denen diese Verfahren angewandt 
werden. Alle in diesem Abschnitt behandelten Modelle prazisieren Vorstellun- 
gen iiber statistische Zusammenhange direkt beobachtbarer oder ,, manifested 1 
Variablen. 

Statistische Zusammenhange konnen erstens zur Priidiktion verwendet wer- 
den. was ein vorrangiges Ziel in der ,,Regressionanalyse ” ist. Nachdem man in 
einer Stichprobe das ,,Zusammenauftreten“ zweier Variablen beobachtet hat. 
kann man in anderen Stichproben den Wert der einen Variablen aus dem Wert 
der anderen vorhersagen. Die Starke statistischer Zusammenhange kann zwei- 
tens aber auch fiir sich genommen von Interesse sein. Sie wird in der Korrela- 
tionsanalyse untersucht. Drittens sind statistische Zusammenhange zwischen 
Gruppen einerseits - welche als qualitative Variablen kodierbar sind - und 
quantitativen Variablen andererseits ein Ausdruck von Unterschieden zwi- 
schen den Gruppen hinsichtlich der Mittelwerte der quantitativen Variablen. 
Die Untersuchung von Mittelwerteunterschieden ist unter den Begriffen ,,t- 
Test”, ,,VaricinzanaIyse“ und ,,Mittelwertevergleiche“ bekannt. Viertens kann 
man statistische Zusammenhange zwischen Gruppen und quantitativen Varia- 
blen zur Vorhersage der Gruppenzugehorigkeit nutzen, sofern der Wert der 
quantitativen Variablen bekannt ist. Untersuchungsmethoden mit diesem Ziel 
heiBen ,,Diskriminanzanalyse“. Liegen nur qualitative Variablen vor, so kann 
man flinftens auftretende Haufigkeiten von Merkmalen mit der ,, Kontingenz- 
analyse" auf statistische Abhangigkeit hin untersuchen. 

Wir zeigen, daB alle fttnf Verfahren zur Beschreibung von Zusammenhangen 
zwischen manifesten (d.h. beobachtbaren) Variablen auf der gleichen formalen 
Theorie basieren, die wir in Abschnitt 2.2 darstellen. Dabei gehen wir nicht 
auf Stichprobenprobleme wie Schatzverfahren und Hypothesenbeurteilung 
(z.B. durch Signifikanztests) ein. Diese sind Gegenstand der nachfolgenden 
Kapitel dieses Bandes. 
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2.2 Eine formale Theorie zur Beschreibung statistischer 
Zusammenhange 

2.2.1 Die Grundannahme 

Die in diesem Abschnitt behandelte Klasse von Modellen zur Beschreibung 
des statistischen Zusammenhangs zwischen einer stochastischen Variablen y 
und mehreren stochastischen Variablen q £ {1,2, . . ., Q} basieren auf fol- 
gender linearen Gleichung 

(2.1) E(y I x u x 2 , . . x Q ) = Po + p, • *1 + p 2 • *2 + • • • + Pq ' *q 

oder in Vektorschreibweise 

E(y | x) = Pq + P'*, 

wobei wir voraussetzen, daB alle beteiligten stochastischen Variablen auf dem 
gleichen Wahrscheinlichkeitsraum (s. FuBnoten 1 und 2) definiert sind und 
eine endliche Erwartung haben. Gleichung 2.1 besagt (siehe auch Anhang C), 
daB die bedingte Erwartung von y bei gegebenen Xj, x 2 , . . ., x Q eine Summe von 
(3 0 und einer Linearkombination der x q ist. Die Variable y bezeichnet man 
haufig als abhangige Variable oder Kriteriumsvariable, die Variablen x q als 
unabhangige Variablen oder Pradiktorvariablen 3 ). |3 0 ist eine Skalenkonstante, 
die angibt, welchen bedingten Erwartungswert die abhangige Variable y hat, 
wenn alle unabhangigen Variablen x q den Wert Null haben. Die reellwertigen 
Koeffizienten (3 q q £ {1,2, . . . Q} sind genau dann gleich Null, wenn kein 
durch Gleichung 2.1 beschriebener statistischer Zusammenhang zwischen y 
und x q besteht. Die |3 q wachsen in ihrem Absolutbetrag mit der ,,Enge“ des 
statistischen Zusammenhanges zwischen y und x q bis zu einem Hochstbetrag, 
der von den Varianzen der beteiligten Variablen abhangig ist. Man beachte 
jedoch, daB diese vereinfachende Interpretation ihre Gultigkeit verliert, wenn 
,,Suppressorvariablen“ (vgl. z.B. Darlington, 1968, S. 164, Fischer, 1974, S. 
75, Conger & Jackson, 1972, Conger 1974) vorliegen. 



2.2.2 Die Residualvariable 

Statistische Zusammenhange sind in der Regel nicht deterministisch. Zwischen 
der bedingten Erwartung £(y|x) und y selbst wird daher meist ein Unterschied 
bestehen. Diese Differenz, namlich 



3 ) Moosbrugger (1980) hat Gleichung 2.1 fur nichtlineare multiple Variablenzusam- 
menhange mit Wechselwirkungen erweitert. Die bedingte Erwartung E(y | x) = (Jq + P’z 
ist dann eine Linearkombination der RSsQ unabhangigen Variablen z,,r £ {1, . . .. R), 
welche beliebige Funktionen der bedingenden Variablen x q sein konnen. 
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(2.2) e: = y - E(y\x ) 

bezeichnen wir als Fehler- oder Residualvariable von y. Fur die abhangige 
Variable y folgt dann aus den Gleichungen 2.1 und 2.2 

(2.3) y = Po + P'* + £ - 

Fiir die Residualvariable von y gilt allgemein 

(2.4) E(e\x) = 0, 

(siehe Anhang C. Regeln 4, 5 und 10), was bedeutet. daB die bedingten Erwar- 
tungswerte der Residualvariablen bei alien Auspragungskombinationen der x q 
gleich Null sind. Ohne diese Eigenschaft wtirde die stochastische Variable 
fOylx) als Werte nicht die bedingten Erwartungswerte fiir y enthalten. 

Eine weitere Eigenschaft der Residualvariablen ist, daB auch ihr unbedingter 
Erwartungswert 

(2.5) E(e) = E[y - E(y\x)] = 0 

gleich Null ist (siehe Anhang C, Regel 9), und daB die Kovarianzen zwischen 
alien unabhangigen Variablen x q und der Residualvariablen £ 

(2.6) C(x, e) — 0 

gleich Null sind (siehe Anhang C, Regel 11). Man beachte, daB mit Gleichung 
2.6 weder gefordert ist, daB die bedingte Fehlervarianz V(s |x=x) fiir alle 
Auspragungskombinationen der x q gleich ist, noch irgendeine spezielle Vertei- 
lungsannahme getroffen wird. 



2.2.3 Kovarianzmodellgleichungen und Parameteridentifikation 

Nachdem wir in Gleichung 2.1 ein statistisches Modell formuliert haben, stellt 
sich nun die Frage, ob die darin enthaltenen Parameter - in unserem Fall sind 
das |3o und die Komponenten von P - eindeutig aus beobachtbaren Vertei- 
lungskennwerten der beteiligten stochastischen Variablen bestimmt (identifi- 
ziert) werden konnen. Im Fall eines Modells vom Typ der Gleichung 2.1 reicht 
die Betrachtung der Modellstruktur fiir den Kovarianzvektor C(x,y) sowie fiir 
die Varianzen V(y) und V(e) aus. 

Die Gleichungen 2.3 und 2.6 implizieren die folgenden Modellstrukturglei- 
chungen 

a) fiir den Kovarianzvektor von x q und y 
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(2 . 7 ) C(x,y) = C[ X, ((3 0 +P'A:+f)] = C(x,x)p 

wobei C(x,x) die Kovarianzmatrix der x q bezeichnet (siehe Anhang B, Regeln 1 
und 2), und 



b) fur die Varianz von y 

(2.8) V(y) = C[(p 0 +P'x+£), (P 0 +P'x+ £ )] = P'C(*,x)p + V(e) 

(siehe Anhang B. Regeln 1 und 2). 

Unter der zusatzlichen Annahme, daB C(x,x) invertierbar ist, erhalten wir die 
Identifikationsgleichung fiir die Koeffizienten P q aus Gleichung 2.7 

(2.9) P = C(X,X)-' C(x,y) 

und jene flir die Varianz der Residualvariablen £ aus den Gleichungen 2.8 und 

2.9 

( 2 . 10 ) V(e) = V(y) - p'C(*,x) P- 

Wenn die Parameter P q und die Residualvarianz V (E ) eindeutig bestimmt sind. 
laBt sich auch die unbekannte Skalenkonstante P 0 leicht berechnen: Aus den 
Gleichungen 2.3 und 2.5 folgt namlich nach Umformen (siehe Anhang A, 
Regel 2) 

(2.11) p 0 = E(y) - p'£(x) 

als Differenz des Erwartungswertes von y und den mit den Koeffizienten P q 
gewichteten Erwartungswerten der x q . 

Lassen sich wie hier alle unbekannten Modellparameter aus den Erwartungs- 
werten, Varianzen und Kovarianzen der beobachtbaren Variablen eindeutig 
bestimmen, so bezeichnet man das Modell als identifiziert. Man beachte, daB 
es sich bei den Gleichungen 2.9 bis 2.11 um Identifikationsgleichungen han- 
delt. Schatzgleichungen, in denen analoge Stichprobenkennwerte verwendet 
werden, finden sich z.B. in Moosbrugger (1978. S. 56 und 61). iiber andere 
Schatzmethoden informieren z.B. Spath (1973, 1974), Harter (1974a, b, 
1975a, b,c), Hoerl & Kennard (1970) oder Humak (1977). 

Wenn C(x,x) nicht invertierbar ist, kann eine allgemeine Losung flir B immer 
durch 

( 2 . 12 ) P = C(x,x)~ C(x,y) 

gefunden werden, wobei C(x,x)- die verallgemeinerte Inverse (vgl. z.B. Rao 
& Mitra, 1971) der Kovarianzmatrix C(x,x) ist. Eine solche Losung wird im 
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allgemeinen jedoch erst durch zusatzliche Nebenbedingungen eindeutig (siehe 
z.B. Moosbrugger & Steyer (1982) in diesem Band). 



2.2.4 Determinierte Varianz, multiple Korrelation und Determinations- 
koeffizient 

Wir bezeichnen mit V [ E(y [ x)] die durch x determinierte Varianz von y. Unter 
Verwendung von Gleichung 2.1 erhalten wir die Beziehung 

(2.13) V [E{y\x)] = C(P'x,P'x) = P'C(x,jc) p. 

Setzen wir Gleichung 2.13 in Gleichung 2.10 ein, so sehen wir, daB die deter- 
minierte Varianz die Differenz von Gesamtvarianz und Residualvarianz ist: 

(2.14) V[E(y\x)] = V(y)-V(e). 

Dividieren wir Gleichung 2.14 durch V(y), so erhalten wir unter Verwendung 
von Gleichung 2.13 und unter der Voraussetzung V(y) ^ 0 den durch x deter- 
minierten Varianzanteil von y : 

(2.i5, vpVlVI .JMpVgl.J LCfeVlt.^). 

V(y) V(y) V(y) 

Dieser Kennwert heiBt multipler Determinationskoeffizient, die positive Wur- 
zel daraus multiple Korrelation (vgl. auch Moosbrugger, 1978, S. 65). Die 
Werte von R~(y,x) liegen zwischen Null und Eins, wobei R 2 (y,x) den Wert 
Null annimmt, wenn P bzw. C(x,y) der Nullvektor ist. 



2.2.5 Multivariate Verallgemeinerung 

Liegen P abhangige Variablen vor, so konnen wir die Grundannahme 2.1 
durch deren multivariate Verallgemeinerung 

(2.16) E(y\x) = p 0 + B'x 

ersetzen. Entsprechend dem Vorgehen beim univariaten (P = 1) Fall erhalten 
wir hier die Modellgleichung fiir die Kovarianzmatrizen 

(2.17) C(x,y) = C(x,x ) B 

und unter der Voraussetzung der Invertierbarkeit von C(x,x), die Identifika- 
tionsgleichungen 

(2.18) B = C(x,x) _1 C(x,y ) 



und 
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(2.19) /?o = E(y) ~ ®'£(x). 

Andernfalls gilt wieder die allgemeine Losung 

(2.20) B = C(x,x)~ C(x,y), 

die erst durch zusatzlich Nebenbedingungen eindeutig wird. 

Als multivariate Verallgemeinerung des multiplen Determinationskoeffizien- 
ten kann der multivariate Determinationskoeffizient 

(2.21) n 2 /_. ..\ Spur {C[£(y|x),£(y|x)] C&y)-'} 

rt ( y,x) p 

angesehen werden (vgl. auch Cramer & Nicewander, 1979), dessert Werte 
zwischen Null und Eins liegen. Dabei ist 

P = Spur [C(y,y) C(y,y )~ l ] = Spur I 

gleich der Anzahl der abhangigen Variablen. Naheres siehe Moosbrugger & 
Steyer (1982) in diesem Band. 



2.2.6 Zusammenfassende Bemerkungen 

Die in diesem Abschnitt dargestellte Theorie beruht auf einer einzigen Annah- 
me, namlich der Gleichung 2.1. Daraus laBt sich die Identifikationsgleichung 
ftir den dabei auftretenden Parametervektor P ableiten, falls C(x,x) invertierbar 
ist. Andernfalls miissen zusatzliche Nebenbedingungen liber die Parameter in 
P formuliert werden, um zu einer eindeutigen Losung ftir P aus den Kova- 
rianzmatrizen C(x,x) und C(x,y) zu gelangen. Analoges gilt ftir den multivaria- 
ten Fall. Mit dem multiplen - bzw. multivariaten Determinationskoeffizien- 
ten kann angegeben werden, wie eng der statistische Zusammenhang zwischen 
y (bzw. y) und x ist. In den nachfolgenden Abschnitten wollen wir verdeutli- 
chen, daft die beschriebenen Konzepte in verschiedensten Situationen der psy- 
chologischen Forschung ihre Anwendung finden. 



2.3 Anwendungen der formalen Theorie. 

In den folgenden Unterkapiteln wollen wir zeigen, um welche Spezialfalle der 
in Kapitel 2.2 dargestellten allgemeinen Theorie es sich bei der Regressions-, 
Korrelations-, Varianz-, Diskriminanz- und Kontingenzanalyse handelt. Da- 
bei werden auch die Zusammenhange zwischen den genannten Analyseverfah- 
ren deutlich. 
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2.3.1 Regressions- und Korrelationsanalyse 

Die Begriffe ..Regression" und , Correlation" entstanden im letzten lahrhun- 
dert. Explizit wurden , .Regression" und ,, Co-Relation" von Galton zumindest 
seit 1889 benutzt (Galton 1889). Galtons erste, aber noch nicht als solche 
bezeichnete ..Regressionslinie" vom Jahre 1877 zeigt die Abhangigkeit des 
Durchmessers von Blatterbsensamen von jenen der zugehorigen Mutterpflan- 
zen. Mit der GroBe des Samendurchmessers der Mutterpflanzen steigt jener 
der Tochterpflanzen an. bei letzteren jedoch in geringerem AusmaB. Diese 
Beobachtung, daB die Durchmesser von Blatterbsensamen der Tochterpflan- 
zen dazu tendieren, zur mittleren GroBe des Samendurchmessers der Vorfah- 
ren zuriickzukehren, bezeichnete Galton 1889 als ,, Regression". Regressions- 
und Korrelationsmethoden wurden dann von Pearson (1896) sowie Yule 
(1897) weiter entwickelt. Doch bereits lange vor Galton wurden ..Regressions- 
analysen" durchgeflihrt, freilich ohne daB dabei dieser Begriff Verwendung 
fand. so z.B. auf geophysikalischem Gebiet von Adrain (1818) oder von den 
Wiener Astronomen Kreil (1831) und Littrow (1818. 1833), welche bereits 

genaue Berechnungsformeln der ..Regressionskoeffizienten" nach der Mini- 
mum-Quadrat-Methode angaben. ( Ausfiihrlichere geschichtliche Angaben 
machen z.B. Weiling, 1972, 1973 und David, 1978). 

In der Regressionsanalyse handelt es sich bei y und den x q in der Regel um 
quantitative stochastische Variablen. Sind z.B. die MeBwerte einer Vp in den 
Variablen x q gegeben und sind die Koeffizienten (3 q in der Gleichung 2.1 
bekannt, so laBt sich der Wert y der Variablen y mit einem bestimmten Fehler 
£ voraussagen. Jeder fur einen festen Vektor x vorhergesagte Erwartungswert 
E(y | X—x) ist eine Realisation der bedingten Erwartung E(y \ x), welche im 
Fall kontinuierlicher Variablen und linearer Beziehungen zwischen y und den 
x q eine Ebene bzw. eine Hyperebene ist und Regressionsebene heiBt. Fiir zwei 
unabhangige Variablen beschreibt E(y\c\jcj) eine Ebene, welche zur Pradik- 
tion von y aus und x 2 benutzt werden kann (siehe Abbildung 2.1). Dabei ist 
|3 0 der Ordinatenabschnitt, also die Hohe, in der die Regressionsebene die y- 
Achse schneidet. (3! die Steigung der Ebene entlang der x r Achse und |3 2 die 
Steigung entlang der x 2 -Achse. 

Das AusmaB der Vorhersagbarkeit von y hangt von der ,,Enge“ des linearen 
statistischen Zusammenhanges ab, die wir mit dent multiples Determinations- 
koeffizienten angeben konnen (siehe Gleichung 2.15). 

Im Fall eines multiplen Regressionsmodells mit zwei Pradiktoren und Interak- 
tion, 

(2.22) E(y | = Po + Ppxq + P 2 x 2 + P 3 x i x 2 

ist die bedingte Erwartung EO. |x lv x: 2 ) eine gekriimmte Flache (siehe Abbil- 
dung 2.2), deren Steigung entlang der x r Achse auf der Stufe x 2 =0 der Parame- 
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Abb. 2.1: Regressionsmodell mit zwei Pradiktoren 
E(y\x u x 2 ) - Po + PiX, + P 2 *2 
mit 



Po = 5.5 

Pi = 0.8 

P 2 = -1.1 



ter (3i angibt und entlang der x 2 -Achse auf der Stufe X! = 0 der Parameter |3 2 . 
Der Parameter |3 3 gibt jenen Anteil der bedingten Erwartung an, welcher auf 
bestimmte Kombinationen von Merkmalsauspragungen in den Variablen X! 
und x 2 zurlickgeht: Von Stufe zu Stufe der Variablen x 2 (bzw. x , ) ist die 
Steigung der Variablen X! (bzw. x 2 ) um |3 3 verschieden (moderiert). Somit ist |3 3 
genau der Unterschied zwischen den Steigungen der Regressionsgeraden von y 
auf X! (bzw. x 2 ) in jeweils zwei um eine Einheit entfernt liegenden Auspragun- 
gen der Variablen x 2 (bzw. x ,). Daher wil'd x 2 (bzw. x ,) als Moderatorvariable 
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Abb. 2.2: Regressionsmodell mit zwei Pradiktoren und Interaktion 
E(y \x u x 2 ) = (3 0 + P x jci + p 2 x 2 + p 3 x,x 2 
mit 

Po = 7.0 

Pi = 0.4 

P 2 = - 2.0 

P 3 = 0.3 



bezeichnet, wenn ^3^0 gilt (vgl. Bartussek, 1970, S. 11, Moosbrugger, 1981 a, 
S. 220). 

Haben wir eine Stichprobe von Werten der Variablen y und x q vorliegen, so 
konnen wir flir multiple Regressionsmodelle unter der Normalverteilungsan- 
nahme der Residualvariablen Hypothesen priifen, indent wir berechnen, wie 
wahrscheinlich es ist, daB alle oder einzelne |3 q in der Population gleich Null 
sind (siehe z.B. Moosbrugger, 1978, S. 72-77), oder daB sie bzw. Linear- 
kombinationen aus ihnen andere hypothetische feste Werte annehmen (siehe 
z.B. Timm, 1975, S. 177ff. oder Moosbrugger & Steyer, 1982, in diesent 
Band). 
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Weiterflihrende Literatur: Die Regressionsanalyse gehort zu den Themen, die von den 
meisten Lehrbuchern der angewandten Statistik behandelt werden. Ausfuhrlichere Ein- 
fiihrungen in die Regressionsanalyse geben Moosbrugger (1978), sowie Gaensslen & 
Schubo (1973), deren Darstellung Matrixalgebra vermeidet. Des weiteren ist auch Ker- 
linger & Pedhazur (1973) zur Einfuhrung geeignet, auBerdem Edwards (1976) sowie 
Draper & Smith (1966). Auf die Bedeutung von komplexen Regressionsmodellen mit 
Moderatorvariablen fiir die differentielle Validitat psychologischer Tests geht z.B. 
Moosbrugger (1981 a) ein. 



2.3.2 Varianzanalyse 

Die Varianzanalyse wurde von Sir R. A. Fisher (1925) fiir die Auswertung von 
landwirtschaftswissenschaftlichen Experimenten entwickelt, bei denen es z.B. 
um die Effekte von Dungemitteln auf den Ertrag ging. Nach dem zweiten 
Weltkrieg hat dieses Verfahren jedoch auch in der Psychologie verstarkt An- 
wendung gefunden, wobei in der Regel die Wirkungen experimenteller Mani- 
pulationen uberpriift werden. Heute zahlt sie zu den Standardverfahren der 
psychologischen Forschungsmethoden. Zur Geschichte der Varianzanalyse 
siehe Weiling (1973). 

Wahrend bei varianzanalytischen Modellen mit Zufallsparametern (random- 
model, vgl. z.B. Hays, 1973, Kap. 13) die |3 q in Gleichung 2.1 stochastische 
Variablen waren, konnen Varianz- und kovarianzanalytische Modelle mit fe- 
sten Parametern (fixed-model, vgl. z.B. Hays, 1973, Kap. 12) als Spezialfalle 
der Gleichung 2.1 angesehen werden. Wir beschranken uns daher auf Modelle 
mit festen Parametern. Bei y handelt es sich dann wieder um eine quantitative 
stochastische Variable, bei den x q jedoch in der Varianzanalyse ausschlieBlich 
um qualitative Indikatorvariablen (synonym auch: Kodier- oder Dummyva- 
riablen), deren Werte die Gruppenzugehorigkeit anzeigen, und in der Kova- 
rianzanalyse (siehe z.B. Moosbrugger, 1978, Kap. 15) um qualitative und 
quantitative Variablen. 

In der einfaktoriellen Varianzanalyse mit zwei Stufen beispielsweise liegen als 
Werte der abhangigen Variablen y eine Reihe quantitativer MeBwerte vor, 
sowie die Information, welcher von zwei Gruppen ein Wert y jeweils ange- 

hort. Von Interesse ist dann der Mittelwerteunterschied von y in beiden Grup- 
pen (z.B. Behandlungs- und Kontrollgruppe). Kodieren wir die Zugehorigkeit 

zur ersten Gruppe mit x = 1 und die zur zweiten Gruppe mit x = - 1, so ergibt 

sich das Datenschema der Abbildung 2.3. 4 ) 



4 ) Man beachte dabei, daB eine Kodierung der Gruppenzugehorigkeit mit 1 und 0 
ebenfalls zu gut interpretierbaren Parametern fuhren wurde (vgl. auch Rochel, 1981). 
Indikationsfragen verschiedener Kodierungsverfahren wurden von Schermelleh (1979) 
untersucht. 
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Abb. 2.3: Datenschema eines einfaktoriellen varianzanalytischen Modells mit zwei 
Stufen, EO , | X) = P o + B X. Die abhangige Variable ist y, die an N] bzw. N 2 
Beobachtungseinheiten in den beiden Gruppen erhoben wird. Die Indika- 
torvariable x enthalt die Information uber die Gruppenzugehorigkeit der 
Beobachtungseinheiten. 



In der Z W ei faktor i el I en Varianzanalyse mit je zwei Stufen (siehe Abbildung 
2.4) beispielsweise liegen die Werte der abhangigen Variablen y vor sowie die 
Information, aus welcher von vier Gruppen ein Wert y jeweils stammt. Von 
Interesse sind lineare oder nichtlineare statistische Zusammenhange zwischen 
den x q und y, welche sieh hier als Unterschiede der Erwartungswerte von y in 
den vier Gruppen zeigen. 





Faktor A 


Stufe 1 


Stufe 2 


Faktor B 


Stufe 1 


1. Gruppe 


3. Gruppe 


Stufe 2 


2. Gruppe 


4. Gruppe 



Abb. 2.4: Zweifaktorieller vollstandig gekreuzter Versuchsplan mit 2 Stufen pro Faktor 



Wir kodieren die zwei Stufen des Faktors A (siehe Abbildung 2.4) durch die 
Kodiervariable X[ mit den Werten x, = 1 fur die Stufe 1 und X[ = -1 firr Stufe 
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2. und die zwei Stufen des Faktors B durch die Kodiervariable x 2 mit den 
Werten x 2 = 1 fur die Stufe 1 und x 2 = -1 fur Stufe 2. Liegen mehr als zwei 
Stufen pro Faktor vor, benotigt man auch mehr als eine Indikatorvariable pro 
Faktor. Man beachte, dab die Art der Kodierung zwar die Interpretation der 
Parameter bestimmt, aber keinen EinfluB auf die Hypothesenbeurteilung hat 
(siehe z.B. Moosbrugger, 1978, Moosbrugger & Steyer (1982) in diesem Band, 
Rochel, 1981, Steyer, 1979 oder Wottawa, 1974). 

Nach dem in Abbildung 2.4 schematisierten kreuzfaktoriellen Versuchsplan 
ergibt sich firr die vier Subpopulationen das in Abbildung 2.5 dargestellte 
Datenschema: 
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Abb. 2.5: Varianzanalytisches Datenschema zum Versuchsplan in Abbildung 2.4. 

In der ersten Spalte ist die abhangige Variable y notiert, die an N g Beobach- 
tungseinheiten in der Gruppe g, g 6 {1,2, 3, 4}, erhoben wird. Die Spalten 2 
und 3 zeigen die Indikatorvariablen x | und x 2 fur die Stufen der Faktoren A 
und B. Die Variable xf x 2 in Spalte 4 ist ein Indikator fur bestimmte 
Faktorstufenkombinationen. Sie dient der Erfassung von Wechselwirkun- 
gen (Interaktionen, s.u.). Wird keine Interaktion angenommen, so entfallt 
die Spalte x, ■ x 2 . 
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Wie in der Regressionsanalyse liegen uns mit den Datenschemata der Abbil- 
dungen 2.3 und 2.5 Werte von stochastischen Variablen vor, deren statistischer 
Zusammenhang mit Gleichung 2.1 beschrieben werden kann. 

Wir untersuchen im folgenden am zweifaktoriellen Design, welche Interpreta- 
tion den Parametern |3 q in diesem Kontext zukommt, zunachst ohne, danach 
mit Annahme einer Interaktion (Wechselwirkung). Ein statistischer Zusam- 
menhang zwischen y und den X q ohne Interaktion liegt dann vor, wenn Mittel- 
werteunterschiede zwischen den Gruppen derart bestehen, daB die Differenz 
der Erwartungswerte zwischen den Stufen des Faktors A auf jeder der Stufen 
des Faktors B gleich groB ist und umgekehrt. 

In welcher Beziehung die Parameter |3 0 und Pq der Gleichung 

(2.23) = P 0 + p,x, + p 2 x 2 

mit den Erwartungswerten von y in den Gruppen stehen, sehen wir, wenn wir 
die bedingten Erwartungswerte von y fur die vier Gruppen bilden: 

(2.24) £(>,): = E(y |x,= 1, x 2 = 1) = Po + Pi + P 2 

(2.25) E(y 2 ): = E(y |x„= 1, x 2 = -1) = Po + Pi - P 2 

(2.26) E(y 3 ): = E(y |x, = -l, x 2 = 1) = Po - Pi + P 2 

(2.27) E(y 4 ): = E(y \x x = -l, x 2 = -1) = Po - Pi ~ P 2 - 

Gewohnlich werden die Gruppen als gleich groB angenommen, was bedeutet, 
daB die Wahrscheinlichkeiten filr die Faktorstufen P(x! = 1) = P(X! = - 1) = 1/2 
und P(x 2 = 1) = P(x 2 =-l) = 1/2 gilt. Dies stellt sicher, daB die unabhangigen 
Variablen X[ und x 2 zueinander orthogonal sind, d.h. nicht miteinander korre- 
lieren, so daB deren Einfliisse auf die abhiingige Variable y voneinander unab- 
hangig geschatzt werden kdnnen. Ist dies nicht der Fall, handelt es sich um 
eine nonorthogonale Varianzanalyse (siehe z.B. Steyer, 1979). 

Unter den obigen Annahmen der Gleichwahrscheinlichkeit filr die Faktoraus- 
pragungen finden wir Null als Erwartungswert der Indikatiorvariablen: 

(2.28) £(*l) ~ £(*1 = 1) ' 1 + P(x,= —1) -—1=0 
und 

(2.29) E(x 2 ) = P(x 2 — 1) • 1 + P(x 2 = -1) --1=0. 

Bilden wir den Erwartungswert von Gleichung 2.23, so erhalten wir dann (vgl. 
Anhang C, Regel 1) 

(2.30) Po = E(y) - P^x,) - P 2 £(x 2 ) = E(y)- 
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Demnach ist |3 0 unter der genannten Voraussetzung gleich dem Erwartungs- 
wert von y. Einsetzen von Gleichung 2.30 in die Gleichungen 2.24 bis 2.27 
ftthrt zu den Losungen fur 



(2.31) 



Pi 



_ E(yQ + Ely , ) 



- Ely) = E(y) ~ 



Ely,) + E(y 4 ) 



und 



(2.32) 



fc = 



E(y0 + E(y 3 ) 



- E(y) = Ely) - 



Ely , ) + E(y 4 ) 



Wir sehen, dafi (3i den ..Haupteffekt von Faktor A“, (vgl. z.B. Hays, 1973, 
S. 494), oder, bezogen auf Abbildung 2.4, den ,,Spalteneffekt“ darstellt, wo- 
hingegen | 3 2 der „Haupteffekt von Faktor B”, oder bezogen auf Abbildung 2.4, 
der ,,Zeileneffekt“ ist 5 ). Abbildung 2.6 veranschaulicht die Beziehungen zwi- 
schen den Parametern und den Erwartungswerten in den vier Gruppen: 




Abb. 2.6: Veranschaulichung der Erwartungswerte von y in den 4 Gruppen eines 
zweifaktoriellen varianzanalytischen Modells gemaB den Gleichungen 2.24 
bis 2.27 mit pg = 3, |3j = 2 und P 2 = 1* 



5 ) Die weitverbreitete Bezeichnung ,,Effekt“ impliziert eine kausale Interpretation, 
welche man strenggenommen nur im Kontext eines kausalen Modells (siehe Steyer, 
1982, in diesem Band) vornehmen sollte. 
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1st der statistische Zusammenhang zwischen den bedingenden Variablen x q 
und der abhangigen Variablen y nichtlinear in den bedingenden Variablen 6 ), so 
moderieren (verandern) die Stufen des Faktors B den Effekt des Faktors A 
oder umgekehrt (vgl. auch Kap. 2.3.1). Einen solchen Moderatoreffekt, der in 
der Varianzanalyse Wechselwirkungs- oder Interaktionseffekt heiBt, konnen 
wir mit einer weiteren Indikatorvariablen X\ • X 2 fiir die Faktorstufenkombina- 
tionen und dem Parameter (J 3 erfassen. Die Spalte 4 in Abbildung 2.5 (S.O.) 
zeigt die entsprechenden Werte von x; x 2 . Ein Flaupteffekt stellt dann den 
durchschnittlichen Effekt eines Faktors gemittelt liber die Stufen des anderen 
Faktors dar. Fiir die bedingte Erwartung von y unter x gilt die folgende Glei- 
chung 

(2.33) E(y | x 1? x 2 ) = P 0 + Pf^ + P 2 x 2 + P 3 xpx 2 . 

Zur Untersuchung, in welcher Beziehung in diesem Fall die Parameter |3 0 und 
(3 q der Gleichung 2.33 mit den Gruppenerwartungswerten stehen, bilden wir 
wieder die bedingten Erwartungswerte von y fiir die vier Gruppen: 

(2.34) £(?,): = E{y |x,= 1, x 2 = 1) = Po + Pi + P 2 + p 3 

(2.35) E(y 2 ): = E(y |x,= 1, x 2 = -1) = p o + - (3 2 - (3 3 

(2.36) E(y } ): = E(y \x x = -\, x 2 = 1) = P„ — (3, -F (3 2 — |3 3 

(2.37) E{y,)-. = E(y |x, = — 1, x 2 = -1) = p 0 - - p 2 + |3 3 . 

Bei gleichgrofien Subpopulationen gelten aufier den Gleichungen 2.28 und 
2.29 auch P{xix 2 = 1) = P(xix 2 = — 1) = 1/2 und £(xpx 2 ) = 0, was wegenE^) 
= E{x 2 ) = 0 wiederum (siehe Gleichung 2.30) zu 

(2.38) Po ^ E(y) 



fiihrt. 



Einsetzen von Gleichung 2.38 in die Gleichungen 2.34 bis 2.37 ergibt unveran- 
derte Ausdriicke fiir Pj und p 2 (siehe Gleichungen 2.31 und 2.32) und zusatz- 
lich eine Gleichung fiir p 3 : 



E(y x ) + E(yP) 
(2.39) P 3 = 



E(y) = E(y) 



E(y 2 ) + £(>3) 



Der Interaktionsparameter, namlich der Koeffizient P 3 der Variablen xpx 2 ist 
genau dann Null, wenn der Erwartungswert von y gleich dem arithmetischen 



61 Zur Klassifikation von linearen vs. nichtlinearen Modellen hinsichtlich der Parame- 
ter P q bzw. linearen vs. nichtlinearen Modellen hinsichtlich den bedingenden Variablen 
x q siehe Moosbmgger, 1980, S. 5-12. 
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Mittel der Erwartungswerte in den Gruppen 1 und 4 bzw. 2 und 3 ist. Dies ist 
der Fall, wenn sich die Erwartungswete von y in den vier Gruppen allein aus 
dem Gesamterwartungswert E(y) = |3 0 und den Parametern (3 X und |3 2 darstel- 
len lassen. Die GroBe von |3 3 wachst mit der Nichtlinearitat, namlich mit der 
Abweichung des Durchschnitts von je zwei, bezogen auf die Abbildung 2.4 
,,diagonalen“, Gruppenerwartungswerten vom Gesamterwartungswert. Der 
Veranschaulichung dient Abbildung 2.7: 



(2i) 




Abb. 2.7: Veranschaulichung der Erwartungswerte von y in den 4 Subpopulationen 
eines zweifaktoriellen varianzanalytischen Modells mit Wechselwirkung ge- 
ma6 den Gleichungen 2.34 bis 2.37 mit Pq = 3, Pj = 2, P 2 = 1 und P 3 = 1 im 
Unterschied zu E(yx \,X 2 ) in Abbildung 2.6. Der Haupteffekt pi = 2 gibt 
hier nur den durchschnittlichen Effekt von Faktor A an, welcher durch die 
Stufen von Faktor B moderiert wird. Die Steigung (der Effekt) auf der Stufe 
Bj betragt (pi + p 3 ) = 3, auf der Stufe B 2 hingegen (Pi - p 3 ) = 1. Die analoge 
Aussage gilt fur Faktor B: auf der Stufe Ai betragt der Effekt (P 2 + p 3 ) = 2, 
auf der Stufe A 2 hingegen (p 2 - P 3 ) = 0; den Durchschnitt zeigt der Haupt- 
effekt P 2 = 1 an. 
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Ebenso wie bei der Regressionsanalyse konnen wir in der Varianzanalyse unter 
der Normalverteilungsannahme Hypothesen priifen, indem wir berechnen, 
wie wahrscheinlich es ist, daB alle oder einzelne |3 q in der Population gleich 
Null sind (siehe z.B. Moosbrugger. 1978, S. 72-77), oder daB Linearkombi- 
nationen der |3 q hypothetische feste Werte annehmen (siehe z.B. Timm, 1975, 
S. 177ff. oder Moosbrugger & Steyer, 1982, in diesem Band), falls wir eine 
Stichprobe von Werten der Variablen y und x q vorliegen haben. 

Weiterfiihrende Literatur: Auch die Varianzanalyse gehort zu den Standardthemen der 
Lehrbiicher fur angewandte Statistik. AuBer den bereits unter der Regressionsanalyse 
(S.O.) genannten Bucher seien Searle (1971), Timm (1975), Bock (1975) und Finn (1974) 
aufgefiihrt. Als ausgesprochenes Standardwerk gilt Winer (197L), der fur sehr viele 
Designs Rechenformeln angibt. Als weitere deutschsprachige Bucher seien Bandemer 
et. al. (1977), Bortz (1977) und Rasch (1976) genannt. Eine Einfiihrung in die multiva- 
riate Varianzanalyse geben Moosbrugger & Steyer (1982) in diesem Band. 



2.3.3 Diskriminanzanalyse 

Auch die Diskriminanzanalyse wurde von R. A. Fisher (1936) entwickelt. Sein 
Anwendungsbeispiel war die Zuordnung von Irispflanzen zu einer von zwei 
Alien auf der Basis der Lange und Breite der Kelch- und Bllitenblatter (Ander- 
son, 1978, S. 628). Die typische Fragestellung der Diskriminanzanalyse in der 
Psychologie ist die der Klas sifikation , namlich, zu welcher von bestimmten 
(z.B. Krankheits-)Gruppen eine Person gehort, von der bestimmte Informa- 
tionen x (z.B. ein oder mehrere Testwerte) vorliegen. 

Formal gesehen ist die Diskriminanzanalyse eigentlich eine Umkehrung der 
Varianzanalyse. Ist es nach einer Varianzanalyse mit bedeutsamen Mittelwer- 
teunterschieden moglich, von der Kenntnis der Gruppenzugehorigkeit der 
qualitativen Variablen auf die durchschnittliche Auspragung der quantitativen 
Variablen zu schlieBen, so ermoglicht in Umkehrung dieses Vorgangs die 
sogenannte Diskriminanzfunktion einen SchluB, in welche der Gruppen eine 
bestimmte Wertekombination der quantitativen Variablen am ehesten klassifi- 
ziert werden kann. 

Die Grundgedanken lassen sich am leichtesten fur den Fall zweier Gruppen 
darstellen. Hierbei ist zu beachten, daB wir, um die formale Vertraglichkeit 
mit der Gleichung 2.1 herbeizufiihren, gegenuber der Varianzanalyse die Be- 
deutung von x und y vertauschen. Nun sei y eine Indikatorvariable, wobei 
y = 1 Zugehorigkeit zur Gruppe 1 und y = 0 Zugehorigkeit zur Gruppe 2 
bedeuten soil. Die quantitativen Informationen seien in den kontinuierlichen 
Variablen x q gesammelt. Da wir in unserer bisherigen Erorterung nur eine 
abhangige Variable gegenuber mehreren unabhangigen zugelassen haben, ist 
mit einer Kodiervariablen y eine Unterscheidung von nur zwei Gruppen mog- 
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lich. Mehrere Gruppen erfordern ein multivariates Modell (siehe z.B. Bock, 
1975, S. 403), um mit mehreren Indikatorvariablen y P mehr als zwei Gruppen 
kodieren zu konnen. 

In der Diskriminanzanalyse heiBt die bedingte Erwartung £(jy|x) auch Diskri- 
minanzfunktion. Wird diese wiederum als linear angenommen, so gilt weiter- 
hin Gleichung 2.1, doch mit der oben erwahnten Vertauschung von x und y 
geht auch eine Veranderung der Bedeutung der Parameter p q einher, welche 
wir kurz untersuchen wollen: 

Die Interpretation der Skalenkonstanten Pq wird erleichtert, wenn wir die 

Erwartungswerte aller kontinuierlichen Variablen x q , q e { 1,2, ,Q}, gleich 

Null setzen. Dann ist 

(2.40) E(y) = E [E{y |x)] = (3„ + p, £(*,) + ... + p Q £(x Q ) = p () • 

Da die Gruppenvariable y nur die Werte y = 1 und y = 0 annehmen kann, gilt 
fur ihren Erwartungswert und folglich fiir Pq 

(2.41) Po = E(y) = P(y = l>l + P(y = 0>0 = P(y = 1). 

Die Skalenkonstante gibt also die Wahrscheinlichkeit an, der mit Eins kodier- 
ten Gruppe anzugehoren, Folglich konnte bei unbekannten Werten der Varia- 
blen x , ebenso wie bei B = 0 eine Vorhersage (Diskrimination) der Gruppen- 
zugehorigkeit nur nach den Gruppenwahrscheinlichkeiten erfolgen. Sind bei- 
de Gruppen zudem gleich wahrscheinlich, so ist eine begrundete Entscheidung 
zwischen beiden Gruppen nicht mehr moglich, weil P 0 = 1/2 wird. 

Die Vorhersagbarkeit wachst hingegen mit der ,,Enge“ des Zusammenhangs 
zwischen y und den Variablen x q , d.h., sofern wir von unveranderten Varian- 
zen der beteiligten Variablen ausgehen, mit wachsender Hohe der Parameter 
P q . Die Diskriminanzfunktion kann bei der hier vorliegenden zweiwertigen 
Gruppenvariablen y wegen 

(2.42) E(y\x) = P(y= l|x)-l + P(y=o|x)-0 = P(y = 1 |x) 

als bedingte Wahrscheinlichkeit, der Gruppe 1 anzugehoren, interpretiert wer- 
den. Liegen die Parameter p q 0 fest, so erhohen die Absolutbetrage der 
Differenzen im Vektor x-E(x) die Sicherheit der Gruppenzuordnung. 

Bei der Annahme einer linearen Diskriminanzfunktion ist zu beachten, daB 

der Wertebereich jeder quantitativen Variablen x q , q 6 {1,2 QJ, deren 

zugehoriger Koeffizient P q ^ 0 ist, auf ein endliches Intervall beschrankt sein 
muB. Andernfalls ergabe sich ein Widerspruch zu der Tatsache, daB die Werte 
von E(y |x) wegen der Kodierung mit Null und Eins als bedingte Wahrschein- 
lichkeiten zu interpretieren sind. Demnach laBt sich beispielsweise die Annah- 
me der multi variaten Normalverteilung der x q innerhalb der beiden Gruppen 
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nicht in Einklang bringen mit der Annahme, daB E(y | x) eine lineare Funktion 
im Sinne der Gleichung 2.1 ist, falls mindestens einer der Koeffizienten (3 q ,q 6 
{1,2 Q), ungleich Null ist. 

Weiterfuhrende Literatur: Eine einfilhrende Darstellung in die Diskriminanzanalyse 
findet man z.B. bei Tatsuoka (1971) oder Marinell (1977). Bock (1975) zeigt dariiber 
hinaus auch, wie man Nutzeniiberlegungen mit der Diskriminanzanalyse verbinden 
kann, was fiir Zuordnungsprobleme insofern von Bedeutung ist, als verschiedene Arten 
von falschen Zuordnungen verschieden groBe Schaden anrichten konnen. 



2.3.4 Kontingenzanalyse 

Von einer Kontingenzanalyse sprechen wir, wenn der statistische Zusammen- 
hang zwischen qualitativen Variablen untersucht wird. Wahrend wir im Ab- 
schnitt iiber die Varianzanalyse die Gruppenzugehorigkeit mit Variablen ko- 
diert haben, deren Werte nur 1 und -1 sein konnten, so verwenden wir hier 
wie in der Diskriminanzanalyse Indikatorvariablen, die nur die Werte 1 und 0 
annehmen. Dies fiihrt zu besonders gut interpretierbaren Parametern. 

Sind sowohl die unabhangigen Variablen x q als auch die abhangige Variable y 
Kodiervariablen fiir jeweils zwei Kategorien, so reduziert sich die Untersu- 
chung der Kovarianzen nach dem Modell der Gleichung 2.1 auf die Analyse 
der Wahrscheinlichkeit des Auftretens von Merkmalskombinationen. Exem- 
plarisch betrachten wir hier den Fall einer 2X2X2 Kontingenzanalyse (siehe 
Abbildung 2.8) sowohl ohne als auch mit Interaktion. 

Zur Interpretation der Parameter im kontingenzanalytischen Modell ohne In- 
teraktion 

(2.43) E(y \x u x 2 ) = Po + |3,x, + P 2 x 2 

untersuchen wir wieder die Erwartungswerte von y bei gegebenem x = x. 
Nach der obigen Gleichung ergibt die Betrachtung des Falles Xj = 0, x 2 = 0 

(2.44) |3 0 = E(y | x, = 0, x 2 = 0) = P(y = 1 | x t = 0, x 2 = 0), 
die des Falles X! = 1, x 2 = 0 

(2.45) Pi = E(y |x, = 1, x 2 = 0) - p 0 = 

= P(y = 1 |xj = l,x 2 = Q)-P(y = 1 |x, = 0, x 2 = 0) 

und die des Falles X[ = 0, x 2 = 1 

(2.46) p 2 = E(y | x, = 0, x 2 = 1) - p o = 

= P(y = 1 |x] = 0, x 2 = 1) — P(y = 1 |x t = 0, x 2 = 0). 
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Abb. 2.8: Kodierung einer dreidimensionalen 2x2x2 Kontingenztafel flir ein Modell 
mit Interaktion. Bei einer Kontingenzanalyse sind alle beteiligten Variablen 
qualitativ. Die unabhangigen Variablen Xj und x 2 enthalten Information liber 
die Gruppenzugehorigkeit einer Beobachtungseinheit. Bei einem Modell 
ohne Interaktion entfallt die Spalte fur Xj x 2 - Eine Merkmalskombination 
liegt mit den Werten der Variablen y, Xj und x 2 fest. 



Der Parameter (3q ist also in einer 2x2x2 Kontingenzanalyse mit der Kodie- 
rung Null und Eins gleich der bedingten Wahrscheinlichkeit flir ,,y = 1“ bei 
gegebenem xj = x 2 = 0 (siehe Gleichung 2.44). Die Parameter (3^ ist nach Glei- 
chung 2.45 die Differenz der bedingten Wahrscheinlichkeiten von y = 1 bei 
gegebenem Xj = 1 bzw. Xj = 0 auf der Stufe x 2 = 0, und der Parameter p 2 ist nach 
Gleichung 2.46 die Differenz der bedingten Wahrscheinlichkeiten von y = 1 bei 
gegebenem x 2 = 1 bzw. x 2 = 0 auf der Stufe = 0. Diese Interpretationen gelten 
sowohl flir den Fall ohne als auch mit Interaktion. 

Legen wir einen Zusammenhang zwischen y und den x q zugrunde, bei dem 
eine Interaktion besteht, so konnen wir die Auspragungskombinationen der 
Variablen x t und x 2 durch die Variable XfX 2 erfassen (siehe die Spalte flir X[-x 2 
der Abbildung 2.8) 

(2.47) E(y \x u x 2 ) = po + Pj*! + p 2 x 2 + P 3 x,-x 2 . 
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Als Identifikationsgleichungen fur die Parameter |3j bis |3 3 dient auch hier die 
Gleichung 2.9, fur |3 0 die Gleichung 2.11. 

Die Interpretation der Parameter |3o, |3 t und |3 2 bleibt unverandert (siehe Glei- 
chungen 2.44 bis 2.46); die fur |1 3 ergibt sich aus der Gleichung 2.47 wie folgt: 

(2.48) |3 3 = E(y |x, = l,x 2 = 1) - (3 0 - |3, - (3, = 

= P(y = 1 | x l = 1, x 2 = 1) — P(y = 1 | X] = 1, x 2 = 0) — 

- [ p (y = 1 |x, = 0, x 2 = 1) - P(y = 1 \x x = 0, x 2 = 0)]. 

Eine Interaktion |3 3 ^ 0 liegt vor, wenn die Differenz der bedingten Wahr- 
scheinbchkeiten P(y = 1 | x 2 = 1) und P(y=l | x 2 = 0) auf den beiden Stufen von 
x t nicht gleich groB ist. 

Als Beispiel fur eine Kontingenzanalyse mit extremer Interaktion behandelt 
Moosbrugger (1980) das sogenannte Meehl'sche Paradoxon (Meehl, 1950). 

Liegen flir die Wahrscheinlichkeiten, einer Untergruppe anzugehoren, Schat- 
zungen vor. so konnen wir unter Beachtung entsprechender Voraussetzung 
(vgl. z.B. Bortz, 1977, S. 202) mit Signifikanztests (% 2 -Tests) uberprufen, wie 
wahrscheinlich es ist, daB alle oder einzelne Parameter |3 q in der Population 
gleich Null sind oder einen anderen hypothetischen festen Wert haben. 

Weiterfuhrende Literatur: Zur Kontingenzanalyse oder Analyse qualitativer Daten gibt 
es eine Vielzahl von unterschiedlichen Ansatzen, welche z.T. (wie etwa die ..loglinea- 
ren Modelle' 1 oder die ..Konfigurationsfrequenzanalyse 11 ) keine Unterscheidung zwi- 
schen abhangigen und unabhangigen Variablen treffen. Die wichtigsten Ansatze schei- 
nen uns durch folgende Autoren vertreten zu sein: Bishop, Fienberg & Holland (1975), 
Cox (1970), Goodman (1978), Krauth & Lienert (1973). 



3. Modelle mit latenten Variablen 

3.1 Einleitung 

Im Alltag erklart man ,,gleichartiges“ Verhalten einer Person in verschiedenen 
Situationen oft, indem man ihr eine Eigen schaft zuschreibt, die f Ur dieses 
Verhalten verantwortlich ist. Verhalt sich jemand beispielsweise effektiv bei 
der Losung von Problemen verschiedener Art, so schreibt man dies seiner 
hohen Intelligenz zu. Diese alltagliche Vorgehensweise kann man durch ma- 
thematische Modelle prazisieren. Das Prinzip dabei ist, daB man die Abhan- 
gigkeiten manifester oder beobachtbarer Variablen (das entspricht dent Verhal- 
ten in verschiedenen Situationen) durch eine oder mehrere latente, d.h. nicht 
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direkt beobachtbare Variablen (das entspricht der Eigenschaft) erklart. Mit 
,,Erklaren“ meint man dabei, daB die Abhangigkeiten zwischen beobachtbaren 
Variablen verschwinden, wenn eine dahinterliegende latente Variable gefunden 
wird. Die latenten Variablen lassen sich dann als hypothetische Konstrukte 
(vgl. Herrmann, 1973 oder Mac Corquodale & Meehl, 1948) interpretieren. 

Die latenten Eigenschaften konnen somit als Ursache fur die Variation und 
Kovariation des beobachteten Verhaltens betrachtet werden (vgl. z.B. Bentler 
1980). Beobachtbare Variablen, deren Kovariation auf eine gemeinsame latente 
Variable zuruckzufuhren ist, heiBen auch kongenerisch (vgl. z.B. Joreskog, 
1971). Abbildung 3.1 zeigt ein einfaches Modell kongenerischer Variablen: 




Abb. 3.1: Modell mit einer latenten Variablen § und drei beobachtbaren Variablen y p , 
bei denen es sich in psychometrischen Anwendungen um drei Tests oder 
auch drei Testitems handeln kann. Die manifestigen Variablen y 1; y 2 und y 3 
hangen mit den Gewichten X. 1; und kj von der gemeinsamen latenten 
Variablen £ sowie jeweils von den spezifischen Residualvariablen ab, welche 
durch unbeschriftete Pfeile gekennzeichnet sind. 



In Kapitel 3.2 werden wir eine allgemeine Theorie latenter Variablen darstel- 
len, auf deren Basis es moglich sein wird, eine Anzahl von Modellen, welche 
auf den ersten Blick durchaus verschieden erscheinen, als Spezialfalle dieser 
Theorie vorzustellen, weil sie sich nur durch die Art der beobachtbaren und 
latenten Variablen unterscheiden. Bei der linearen Faktorenanalyse 7 ) mit ei- 
nem Faktor sind sowohl die manifesten Variablen als auch die latente Variable 
(= Faktor) kontinuierlich. Beim , .linear traceline model“ (siehe z.B. Lazars- 
feld & Henry, 1968, S. 206 oder Fischer, 1974, S. 160) sind die manifesten 
Variablen zweiwertig und die latente Variable kontinuierlich. Beim ,, latent 



7 ) Damit ist die Faktorenanalyse im Sinne von Spearman (1904. 1926), Thurstone 
(1947) und Joreskog (1966) gemeint und nicht die Hauptkomponentenanaly se nach 
Pearson (1901) und Hotelling (1933). Die Unterschiedlichkeit beider Ansatze beschrei- 
ben z.B. Lawley & Maxwell, 1971, S. 2-4). 
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profile model” (siehe z.B. Gibson, 1959) sind die beobachtbaren Variablen 
kontinuierlich und die latente Variable reprasentiert nur die Zugehorigkeit zu 
einer latenten Klasse. Beim ,, latent class model “ (siehe z.B. Lazarsfeld & Hen- 
ry, 1968, S. 46) sind die manifesten Variablen zweiwertig und die latente Va- 
riable reprasentiert ebenfalls nur die Zugehorigkeit zu den Klassen. SchlieBlich 
kann auch das ,,klassische latent-additive Testmodell“ (siehe Moosbrugger & 
Muller, 1980, 1981, 1982) in diesem Kontext abgehandelt werden. 

Wahrend alien vorgenannten Modellen eine lineare Variablencharakteristik zu- 
grundeliegt, werden wir auch auf andere Gruppen von Modellen, namlich 
solche mit polynomialer Variablencharakteristik (Lazarsfeld, 1950, McDonald 
1967) sowie solche mit logistischer Variablencharakteristik (Rasch 1960, Birn- 
baum 1968) eingehen, die sich in formaler Hinsicht nur geringfilgig von den 
linearen Modellen unterscheiden. 

Die genannten Modelle konnen auch flir mehrere latente Variablen verallge- 
meinert werden. Zur Einfuhrung der wesentlichen Konzepte reicht jedoch der 
Fall einer einzigen latenten Variablen aus, welche die Abhangigkeiten zwi- 
schen den beobachtbaren Variablen erklart. Auch in diesem dritten Abschnitt 
ist es nicht unser Ziel, einen umfassenden Uberblick liber Anwendungsmog- 
lichkeiten, Probleme der Parameterschatzung und Hypothesenbeurteilung zu 
geben, sondern vielmehr die gemeinsamen theoretischen Grundlagen und Be- 
ziehungen herauszuarbeiten. 



3.2 Eine allgemeine Theorie lat enter Variablen 

In diesem Abschnitt stellen wir zunachst die Annahmen der Theorie latenter 
Variablen und die wichtigsten Folgerungen zusammen. Danach untersuchen 
wir, wann und wie sich die unbekannten Parameter aus den statistischen 
Kennwerten manifester Variablen, namlich aus Erwartungswerten, Varianzen 
und Kovarianzen, eindeutig bestimmen lassen. 

3.2.1 Die Grundannahmen 

Die formale Theorie latenter Variablen basiert auf zwei Grundannahmen, 
namlich auf der bedingten stochastischen Unabhangigkeit der manifesten Va- 
riablen und auf der Art der Variablencharakteristik. 



3. 2. 1.1 Bedingte Unabhangigkeit 

Der Grundgedanke von Modellen zur Erklarung der Abhangigkeiten beob- 
achtbarer oder manifester Variablen y P , p £ { 1 ,2, . . . ,P } , durch eine latente 
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Variable besteht darin, daB fiir jeden festen Wert der latenten Variablen £ keine 
Abhangigkeit mehr zwischen den manifesten Variablen y p besteht. Ein Beispiel 
soil dies erlautern: Handelt es sich bei den y p um psychologische Testvaria- 
blen, welche miteinander korrelieren, so wird per Modellannahme erwartet. 
daB die Korrelationen verschwinden, wenn man die Testvariablen Vpn vor- 
legt. welche gleiche Auspragungen der latenten Variablen £ aufweisen. Flir 
diese Vpn sollen die Testvariablen dann unabhangig sein. 

Formal laBt sich dieser Gedanke wie folgt formulieren: Fiir alle nichtleeren 
Teilmengen J der Indexmenge { l,2,...,p, ...,P} gelte (vgl. Anderson 1959, S. 
11, Lord & Novick 1968, S. 543) 

(3.i) f(ruu) =n^ P U). 
peJ ^ 

wobei n das Produktzeichen ist. Nach dieser Gleichung ist die bedingte Er- 
wartung des Produkts der Variablen y p gleich dem Produkt der bedingten 
Erwartungen der Variablen y p . Zufallsvariablen y p , welche diese Gleichung 
erfiillen, heiBen bedingt linear stochastisch unabhangig. 

Diese Bedingung sei fiir zwei Variablen y p , p 6 {1,2} mit den Werten y p = 1 und 
y p = 0 veranschaulicht. Die bedingte Erwartung ist dann als bedingte Wahr- 
scheinlichkeit interpretierbar, da E(y p | £) = 1 P(y p = 1 | £) + 0 . P(y p = o|£) 
= P(y p , = 1 | £) gilt. In Gleichung 3.1 erkennen wir dann das bekannte Multi- 
plikationstheorem der Wahrscheinlichkeitsrechnung (vgl. z.B. Bortz, 1977, 
S. 71), welches besagt, daB zwei Ereignisse dann bedingt stochastisch unabhan- 
gig sind, wenn ihre Verbundwahrscheinlichkeit P(y! = 1 | £), (y 2 = 1 | £)] = 
P(y t = 1 | £) . P(y 2 = 1 | £) als Produkt der bedingten Einzelwahrscheinlichkei- 
ten darstellbar ist. 

In der allgemeinen Theorie latenter Variablen niachen wir ausdriicklich keine 
Verteilungsannahmen. Fiir die beteiligten Zufallsvariablen setzen wir jedoch 
voraus, daB sie eine endliche Erwartung haben. 



3.2. 1.2 Variablencharakteristische Funktion (VC-Funktion) 

Die bedingte Erwartung E(y p | £) nennen wir im vorliegenden Zusammenhang 
auch variablencharakteristische Funktion, abgekiirzt VC-Funktion 8 ). Sie gibt 
fiir jeden Wert ^ der latenten Variablen £ an, welchen (bedingten) Erwartungs- 
wert E(y p , |^= ^)die manifeste Variable y p , p e {1,2,...,P}, hat. Die Ver- 
schiedenheit der hier behandelten Modelle zur Erklarung der Abhangigkeit 



8 ) Andere Bezeichnungen sind: Variablen-. Itemcharakteristik, itemcharakteristische 
Funktion). 
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manifester Variablen durch eine latente Variable besteht darin, von welchem 
Typ die variablencharakteristische Funktion E(y p j £) ist. 

a) Bei linearer VC-Funktion legt man den Typ von E(y p | £) durch die Glei- 
chung 

(3.2) E (y P I i) = 

fest. Nach Gleichung 3.2 ist die bedingte Erwartung der manifesten Variablen 
y p eine lineare Funktion der latenten Variablen In Abbildung 3.2 ist eine 
lineare VC-Funktion fur den speziellen Fall kontinuierlicher latenter und ma- 
nifester Variablen dargestellt. Man beachte, dafi bei einer diskreten latenten 
Variablen £ (siehe z.B. Abb. 3.7) auch die Variablencharakteristik E(y p | £) 
diskret ist. 




Abb. 3.2: Lineare VC-Funktion bei kontinuierlichen manifesten Variablen und einer 
kontinuierlichen latenten Variablen. Die Gerade E(y p | £) gibt ftir jeden 
Wert § der latenten Variablen § den fur y p erwarteten Wert an. In diesem 
Fall wurden willkurlich k p0 = 1.0 und k p = 0.6 angenommen. 



b) Bei polynomialer VC-Funktion legt man den Typ von E(y p | £) durch die 
Gleichung 

(3.3) £ (T p U) = V + + K^ 2 + 

fest. Die bedingte Erwartung der manifesten Variablen y p ist dann eine kurvili- 
neare Funktion der latenten Variablen wie sie in Abb. 3.3 fiir Polynome 2. 
Ordnung dargestellt ist: 
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Abb. 3.3: Nichtlineare VC-Funktion bei kontinuierlichen manifesten Variablen und 
einer kontinuierlichen latenten Variablen in Form eines Polynoms 2. Ord- 
nung, hier willkurlich mit X p Q = 0.5, X pl = 0.2 und X p 2 = 0.3. Die Parabel 
E ( y p £)gibt fur den fasten Wert § der latenten Variablen £ den fur y p 
erwarteten Wert an. 



c) Bei logistischer VC-Funktion legt man den Typ von E(y p ( £) durch die 
Gleichung 



(3.4) 






exp ( X p0 + X p g) 

1 + exp (X. p0 + X p £) 



fest, wobei exp(X p0 + X p £) = e Xp0 + X p |f gilt mit e = 2.718, der Euler’ schen Zahl. 
Die bedingte Erwartung der manifesten Variablen y P ist dann eine logistische 
Funktion der latenten Variablen Der Zusammenhang ist in Abbildung 3.4, 
S. 31, dargestellt: 



3.2.3 Die Residualvariablen 

Bei Modellen mit einer latenten Variablen £ ist der Zusammenhang zwischen § 
und den manifesten Variablen y p nicht deterministisch, d.h. zwischen den y P , 

p S {1,2, P}, und deren bedingten Erwartungen E(y p | £) wird in der Regel 

eine Differenz 



(3.5) 



y p ^(Xp £)> 
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Abb. 3.4: Logistische VC-Funktion, hier willkiirlich mit den Parametern X pQ =1.0 
und = 0.8. Der Parameter X, p beschreibt die „Steilheit“ der VC-Funktion, 
der Parameter X p0 ihre Lokation. Bei X p o + X, p £; = 0, d.h. bei § = ■~X p o/X, p gilt 
immer E(y p | £) = 1/2. Die bedingte Erwartung kann hier nur Werte zwi- 
schen Null und Eins annehmen. Auch bei diskreten manifesten Variablen y p 
ist E(y p | £) kontinuierlich. 



bestehen, die wir als Residualvariablen bezeichnen. Diese haben die Eigen- 
schaft, daB ihr bedingter Erwartungswert fur alle Auspragungen von £ gleich 
Null ist: 

(3.6) £(£ p U) = 0 

(siehe Anhang C, Regel 10). Fur die Residualvariablen £ p gelten die weiteren 
Eigenschaften 

(3 . 7) E(e p ) = E[E(e p | §)] = 0, 

(siehe Anhang C, Regel 1), und 

(3.8) C(|,£ p ) = C[§,j p - £(>pU)] = 0 

(siehe Anhang C, Regel 11). Nach Gleichung 3.7 ist also auch der unbedingte 
Erwartungswert der £ p gleich Null, ebenso wie nach Gleichung 3.8 die Kova- 
rianzen zwischen £ und den £ p Null sind. 

Eine weitere Konsequenz aus der Modellannahme 3.1 ist, daB Residualvaria- 
blen Ep paarweise nicht kovariieren 

C(f p ,£p.:-) = 0, fiir alle p, p* e {1,2,...,P} mit p=Ap :; '. 



(3.9) 
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3.2.4 Kovarianzmodellgleichungen und Identifikation 

1m folgenden untersuchen wir fiir lineare VC-Funktionen. welche Folgerun- 
gen sich aus den Modellannahmen (Gleichungen 3.1 und 3.2) fiir die Modell- 
gleichungen der Erwartungswerte, Varianzen und Kovarianzen der beobacht- 
baren Variablen y p ergeben, und anschliefiend, ob und wie sich die Parameter 
X p o, X p , V(£) und ^( e & aus den Erwartungswerten, Varianzen und Kovarianzen 
der y p eindeutig bestimmen lassen. Dies ist die Frage der Identifizierbarkeit. In 
manchen Fallen konnen, wie wir in Abschnitt 3.3.3 erwahnen, auch Modell- 
gleichungen fiir Momente hoherer Ordnung zur eindeutigen Bestimmung von 
Modellparametern beitragen. 

Nach den Gleichungen 3.2 und 3.5 gilt fiir y p 

(3.10) y p = X p0 + X p £ + £ p . 

Daraus und aus den Gleichungen 3.8 und 3.9 folgen die Modellgleichungen fiir 
die Kovarianzen der Variablen y p 

(3.11) C(y p ,j p ») = C(X p0 + X p £ + e p , X p » 0 + X p »£ + e p .) = 

= X P C(£,£) V + C(£ p ,v) = 

JX p X p « V(§), fur p # p* 

1 V V(£) + V(£ p ), fiir p = p* 
fiir alle p,p ;: ‘ 6 {l, 2 ,...,p}. 

Fiir p = p* geben die Gleichungen 3.11 die Modellgleichungen fiir die Varianz 
der beobachtbaren Variablen y p an. Die durch die latente Variable £ erklarte 
Varianz einer manifesten Variablen y p ist gleich X p V(£) und somit gleich X p , 
wenn £ auf die Varianz V(£) = 1 normiert wil'd. 

Liegen drei beobachtbare Variablen y p vor, wie in Abbildung 3.1 veranschau- 
licht, so implizieren die Annahmen 3.1 und 3.2 genau sechs Kovarianzmodell- 
gleichungen (vgl. auch die ,, accounting equations" von Lazarsfeld 1959, 
S. 504), welche die drei bekannten Varianzen und die drei bekannten Kova- 
rianzen der beobachtbaren Variablen y p mit den drei unbekannten Ladungen 
Xp und den drei Fehlervarianzen V(f p ) verbinden. Die Gleichungen 3.11 ent- 
halten in diesem Fall genau P(P + l)/2 = 6 Modellgleichungen fiir die Kovarian- 
zen, die gerade genugen, um eindeutig die sechs Parameter Xj, Xj, X 3 , V(£i), 
\\Eij, V(£y) zu bestimmen, wenn wir entweder die Varianz der latenten Varia- 
blen £ festlegen oder einem Parameter X p einen bestimmten festen Wert geben: 
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Wir leiten zunachst aus den Modellgleichungen 3.11 filr die Kovarianzen der 
beobachtbaren Variablen die Identifikationsgleichung filr Xj ab. Dazu bilden 
wir durch dreimaliges Benutzen von Gleichung 3.11 flir p ^ p* den Ausdruck 

C(yi,y 2 ) ■ C(y u yi) _ X,V(£)X 2 • X,V(£) X 3 _ 2 

(3.12) — r — — t — \J7V\~\ V\Sh 

C(y 2 ,y 2 ) x 2 V(§) x 3 



Filr den Koeffizienten Xi erhalten wir demnach 



(3.13) X t 



I C(y u y 2 ) • C(y„y } ) 
V C(y 2 ,y 3 ) ■ V(|) 



Wenn wir die Variablen y p so definieren, daB sie positiv mit £ kovariieren, so 
hat X ( immer ein positives Vorzeichen. Da die Kovarianzen der manifesten 
Variablen y p gegebene GroBen sind, sieht man aus den Gleichungen 3.12 und 
3.13, daB mit der Festlegung der Varianz V(t;) der Koeffizient X[ gegeben ist 
bzw. umgekehrt mit der Festlegung von X 3 auch V(£), Da die Numerierung der 
Variablen y p beliebig ist, kann man Gleichung 3.13 entsprechend filr jede der 
Variablen y , p e (1,2,3) verwenden. 



Wenn wir bedenken, daB wegen C(y p ,£) = C(Xp 0 + X p ^+fp , £) = X p V(£) filr die 
Koeffizienten X p 



(3.14) 



_ C(y P & 

V(!) 



gilt, so sehen wir, daB X p um so groBer wird, je kleiner die Varianz von £ 
festgelegt wird. Dariiber hinaus ist zu beachten. daB X p > X p .> nur dann auf 
einen starkeren Zusammenhang zwischen y p und £ gegeniiber y p „ und § hin- 
weist, wenn y p und y p » gleiche Varianzen haben. 



1m Abschnitt 3.3.3 werden wir einen Fall kennenlernen, bei dem V( £) nicht 
beliebig festzulegen ist. In diesem Fall hat V(£) eine wichtige empirische Be- 
deutung, und wir werden sehen, daB durch Beriicksichtigung der Modell- 
struktur filr die zentralen Momente dritter Ordnung C(y 1 ,y 2 ,y 3 ) in diesem Fall 
auch die Varianz V(£) eindeutig bestimmt werden kann. 

Aus den Gleichungen 3.11 (filr p = p*) erhalten wir auch die Identifikations- 
gleichungen filr die Fehlervarianzen V{e f ), wenn wir filr X p V(J;) den linken 
Ausdruck aus Gleichung 3.12 einsetzen. Die folgende Gleichung gilt wieder 
filr alle Variablen y wenn man die Indices entsprechend umnumeriert: 

(3.15) V(e,) = V(y /,) - C(jb ^ 

Sind die Parameter X p und V(c p ) erst einmal eindeutig bestimmt. so kann man 
auch die Skalenkonstanten X p0 unter Verwendung von Gleichung 3.10 aus 
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(3.16) E(y p ) - X p o + £(£) 

eindeutig bestimmen, wenn man £(£) festlegt. Gewohnlich wird die Normie- 
rung £(£) = 0 gewahlt. 

Allgemein erhalt man bei einem Modell mit P kongenerischen Variablen genau 
P(P+l)/2 Kovarianzgleichungen (siehe Gleichungen 3.11) mit 2'P unbekann- 
ten Parametern, namlich den X p und V{s p ), und auBerdem P Gleichungen flir 
die Erwartungswerte der y p mit weiteren P unbekannten Parametern, namlich 
den Skalenkonstanten ^ p0 . Liefert ein Modell nur so viele Gleichungen fiir die 
Kovarianzen wie zu bestimmende Parameter, so kann das Modell zwar identi- 
fizierbar sein, es ist aber empirisch noch nicht uberpriifbar, da es zu einer 
perfekten Anpassung des Modells an die Daten einer Stichprobe fiihren wiirde. 
Erst wenn P > 3 ist, hat man mehr Gleichungen als Unbekannte, und man 
spricht von Uberidentifikation. In diesem Fall konnen zumindest einige Para- 
meter durch mehrere Gleichungen bestimmt werden und das Modell wird 
empirisch iiberprufbar. 



3.2.5 Beispiel 

Ein fiktives Beispiel soli die oben dargestellte Theorie erlautern. Wir gehen 
davon aus, daB die folgenden Varianzen, Kovarianzen und Korrelationen zwi- 
schen den kongenerischen Variablen y h y 2 und y 3 fiir eine bestimmte Popula- 
tion bekannt und in Tabelle 3.1 gesammelt sind. Dabei enthalt die untere 
Dreiecksmatrix die Korrelationen, die obere die Kovarianzen und die Haupt- 
diagonale die Varianzen: 



Tabelle 3.1: Korrelations- (untere Dreiecksmatrix) und Kovarianzmatrix 
(obere Dreiecksmatrix) fiktiver Daten. 





y i 


T2 


y 3 


y i 


4.00 


0.90 


4.20 


yi 


0.90 


0.25 


1.20 


y 3 


0.70 


0.80 


9.00 



Die Parameter X. p und V(e p ), die unter der Normierung V(£) = 1 nach den 
Gleichungen 3.13 und 3.15 berechnet wurden, sind in Tabelle 3.2 gesammelt. 

Wahlen wir z.B. eine Personengruppe A mit der Auspragung in der laten- 
ten Variablen und eine Personengruppe B mit der um eine Einheit hoheren 
Auspragung = 5 a + 1. so erwarten wir nach Gleichung 3.2 fiir Personen der 
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Tabelle 3.2: Modellparameter fiir das fiktive Zahlenbeispiel der Tabelle 3.1. 







V(e P ) 


yi 


1.77 


0.87 


yi 


0.50 


0.00 




2.37 


3.38 



Gruppe B verglichen mit Personen der Gruppe A in der manifesten Variablen 
y x eine um 1.77, in y 2 eine um 0.50 und in y 3 eine um 2.37 Einheiten „hohere“ 
Merkmalsauspragung. Eine vergleichende Reihung der Gewichte hinsicht- 
lich des Grades der Abhangigkeit der manifesten Variablen y p von der latenten 
Variablen £ ist erst moglich, wenn alle beobachteten Variablen auf die gleiche 
Varianz normiert werden. 

Bis auf Rundungsfehler laBt sich mit diesen Daten und den Gleichungen 3.11 
die Ausgangskovarianzmatrix exakt reproduzieren. Bei drei Variablen y p laBt 
sich diese perfekte Anpassung des Modells an die Daten mit jeder beliebigen 
Korrelationsmatrix erzielen, in der alle Eintragungen von Null verschieden 
sind. Erst bei vier beobachteten Variablen y p ware dies nicht zwangslaufig der 
Fall, womit das Modell dann empirisch uberpriifbar ware. Dabei ist die inhalt- 
lich wichtigste Frage, ob eine latente Variable zur Erklarung der beobachteten 
Zusammenhange ausreicht. 



3.2.6 Modell paralleler Variablen 

Fiihrt man noch restriktivere Annahmen ein, als sie in der formalen Theorie 
latenter Variablen mit linearer VC-Funktion (Gleichungen 3.1 und 3.2) ge- 
macht wurden, erhalt man das Modell paralleler Variablen (vgl. hierzu den 
Begriff ,,parallele Tests“ in der klassischen Testtheorie, z.B. in Fischer, 1974, 
S. 34). Beim Modell paralleler Variablen werden zusatzlich die Gleichungen 

(3.17) X P 0 = X 0 ; X. 2 = X 2 ; V(e p ) = V(e), fiir alle p 6 {1,2,...,P}, 

angenommen. Parallele Variablen haben demnach gleiche Erwartungswerte 
(das folgt aus den Gleichungen 3.16 und 3.17), gleiche erklarte Varianzen 
X 2 V(£) (siehe Gleichungen 3.11 fiir p = p*) und gleiche Fehlervarianzen. Paral- 
lele Variablen sind in diesem Sinn austauschbar, denn sie messen dieselbe 
latente Eigenschaft auf der gleichen Skala gleich gut. Kongenerische Variablen, 
die nicht zugleich parallel sind, messen hingegen dieselbe Eigenschaft auf ver- 
schiedenen Skalen verschieden gut. 
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3.2.7 Zusammenfassende Bemerkungen 

Die in diesem Abschnitt dargestellte allgemeine formale Theorie liegt den in 
den folgenden Abschnitten zu behandelnden Modellen zugrunde. Sie besteht 
aus zwei Grundannahmen, der bedingten stochastischen Unabhangigkeit (sie- 
he Gleichung 3.1) und der Art der Variablencharakteristik (siehe Gleichungen 
3.2 bis 3.4). Diese beiden Annahmen geniigen zur eindeutigen Bestimmung 
der Modellparameter (siehe flir lineare VC-Funktion die Gleichungen 3.13 
und 3.15) sofern Varianzen und Kovarianzen von geniigend vielen beobacht- 
baren Variablen vorhegen und die Varianz der latenten Variablen festgelegt 
wird. Bei restriktiveren Annahmen liber die Modellparameter geniigen fiir 
deren eindeutige Bestimmung bereits zwei beobachtbare kongenerische Varia- 
blen, die wir dann auch ,,parallel“ nennen. 

Weiterfiihrende Literatur: Die Theorie latenter Variablen ist zunachst nur in Ansatzen 
behandelt worden (siehe z.B. Anderson 1959, Lord & Novick 1968). Eine monogra- 
phische Abhandlung liefert Harnerle (1982). 



3.3 Anwendungen der allgemeinen Theorie latenter Variablen 

3.3.1 Faktorenanalyse 

Als erste Anwendung der im Abschnitt 3.2 dargestellten Theorie behandeln 
wir die lineare Faktorenanalyse mit einem Faktor (einer latenten Variablen). 

Von der Faktorenanalyse in dem hier verwendeten engeren Sinn (Spearman 
1904. 1926, Thurstone 1947, Joreskog 1966) muB die ,,Hauptkomponenten- 
analyse“ (Pearson 1901. Hotelling 1933) unterschieden werden. Wahrend es 
Ziel der Faktorenanalyse ist, die Kovarianzmatrix von kongenerischen Varia- 
blen durch eine geringe Anzahl von Faktoren (latenten Variablen) zu erklaren, 
beschrankt sich die Hauptkomponentenmethode darauf, eine Kovarianzmatrix 
von Variablen durch orthogonale Komponenten, welche auch Faktoren ge- 
nannt werden, aber dem theoretischen Anspruch latenter Variablen meist nicht 
geniigen, zu beschreiben (vgl. z.B. Lawley & Maxwell, 1971, S. 2-4). Die 
Hoffnung in der bisherigen Forschung, exploratorisch mit der haufig ange- 
wendeten Hauptkomponentenmethode geeignete Theorien ,,automatisch“ zu 
finden, konnte sich deshalb nur kaurn erfiillen. Doch seit Joreskog (1967, 
1969, 1973) rechentechnische Probleme in der Faktorenanalyse gelost hat, ist 
auch die Uberpriifung von Theorien mit konfirmatorirchen Faktorenanalysen 
praktisch leicht durchfuhrbar (siehe Sorboni & Joreskog, 1976, Joreskog & 
Sorbom, 1978). 

In der Faktorenanalyse werden sowohl die latente Variable £ (der Faktor) als 
auch die beobachtbaren Variablen y p als kontinuierlich angenommen. Dann ist 
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auch die lineare Variablencharakteristik E(y p |£) kontinuierlich (siehe Abbil- 
dung 3.5). Sie kann als Regressionsgerade zwischen der jeweiligen Variablen y p 
und der latenten Variablen £ angesehen werden. Die Werte ^ von £ heiBen in 
der Faktorenanalyse ,, factor scores“. 




Abb. 3.5: Faktorenanalytisches Modell mit einem Faktor als Spezialfall der allgemei- 
nen Theorie latenter Variablen mit linearer VC-Funktion entsprechend 
Gleichung 3.2 sowie kontinuierlichen manifesten und kontinuierlicher la- 
tenten Variablen. Die Gerade £(y p |f) gibt fur jeden Wert £; (factor score) der 
latenten Variablen § den fur y P erwarteten Wert an. In der Faktorenanalyse 
sind die Normierungen E(y p ) = E( £) = 0 iiblich, wodurch die Skalenkon- 
stanten A. p0 = 0 sind. Die Ladung X p wurde hier willkiirlich mit X p = 0.8 
angenommen. 



Die Gewichte X p werden in der Faktorenanalyse ,,Ladungen“ der Variablen y P 
auf | genannt. 1st die Varianz V(£) auf Eins normiert, so ist \ 2 V die ,,Kommuna- 
Iitat“ der Variablen y P . Die Gleichungen 3.11 zeigen, daB es sich dabei um die 
durch B, erklarte Varianz von y P handelt. also um y[£(y p |^)]. 

Als klassischen Anwendungsfall konnen wir Spearman’s Generalfaktor-Theo- 
rie betrachten (Spearman. 1904). 
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Weiterfuhrende Literatur: Als deutschsprachige Lehrbiicher seien Pawlik (1968), Re- 
venstorf (1976, 1980 ) und Uberla ( 1971 ) genannt. Revensdorf (1980), Anderson & 
Rubin (1956) sowie Lawley & Maxwell ( 1971 ) gehen ausfiihrlicher auf die statistischen 
Probleme der Faktorenanalyse ein, als die Monographien von Mulaik (1972), Hannan 
(1967) oder Horst (1965), welche ebenso wie die oben angefiihrten deutschsprachigen 
Autoren mehr Platz der Hauptkomponentenanalyse widmen. Die nichtlineare Fakto- 
renanalyse (entsprechend Gl. 3.3) wird z.B. von McDonald (1967) behandelt. 



3.3.2 ,, Linear traceline model” 

In diesem Abschnitt untersuchen wir, welche Besonderheiten sich filr die 
Interpretation einiger Gleichungen und Parameter ergeben, wenn man zusatz- 
lich zu den Modellannahmen der Gleichungen 3.1 und 3.2 festlegt, daB die 
latente Variable kontinuierlich ist, die manifesten Variablen aber zweiwertig 
sind. 

Lazarsfeld (vgl. Lazarsfeld & Henry, 1968, S. 206) hat ein Modell eingefuhrt, 
das von einer linearen Beziehung zwischen der kontinuierlichen latenten Va- 
riablen £ und den zweiwertigen beobachtbaren Variablen y P ausgeht, das ,, line- 
ar traceline model”. Wir zeigen daher in diesem Abschnitt zunachst, daB das 
Lazarsfeld’sche Modell mit linearer Variablencharakteristik (,, linear traceline”) 
ein Spezialfall des allgemeinen Modells latenter Variablen ist, wenn man von 
zweiwertigen manifestigen Variablen und einer kontinuierlichen latenten Va- 
riablen ausgeht. 

In den Gleichungen 3.1 und 3.2 sind die Annahmen des allgemeinen linearen 
Modells latenter Variablen formuliert. Die zusatzlichen Annahmen des ,, linear 
traceline model” bestehen in der notwendigen (vgl. dazu Wottawa, 1979, 
S. 49) Einschrankung von £ auf das Intervall [^ 1 ,^ 2 ] und i n der Festlegung, daB 
£ kontinuierlich ist, die y P aber nur die Werte 0 bzw. 1 annehmen konnen. Wir 
untersuchen nun, welche Folgerungen sich aus diesen Festlegungen ergeben: 

Die erste Besonderheit betrifft die lineare VC-Funktion, filr die in diesem Fall 
gilt: 

(3.18) E(y p | £) = P(y p = 1 | £) = X, p0 + X, p |. 

Demnach ist die bedingte Wahrscheinlichkeit, daB y P den Wert 1 unter £ = 'E, 
annimmt, eine lineare Funktion der latenten Variablen £, (siehe Abbildung 
3.6). Hier wird deutlich, daB das allgemeine Modell latenter Variablen zu 
einem ,,probabilistischen Modell” wird, wenn y P nur zwei Werte annehmen 
kann, welche mit 0 und 1 kodiert werden (vgl. auch Abschnitt 3.3.4). Der 
einzige Unterschied zwischen dent faktorenanalytischen und dem probabilisti- 
schen Modell in Gleichung 3.18 besteht darin, daB die Werte der bedingten 
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Erwartung E(y p |£) im letzteren Fall als bedingte Wahrscheinlichkeiten inter- 
pretiert werden konnen. 

Bei psychometrischen Tests, in denen £ eine latente Fahigkeit reprasentiert, 
kann bei der Kodierung y p = 0 fiir ,,Nichtlosung“ und y p = 1 fur ,,Losung“ 
einer Aufgabe p die Konstante X p0 als Leichtigkeit der Aufgabe p interpretiert 
werden. Die unbedingten Erwartungswerte der beobachtbaren Variablen 

(3.19) E(y P ) ~ E(k p0 + X p £ + £ p ) = X p0 + X p £(£), 
vereinfachen sich namlich bei der Normierung £(£) = 0 zu 

(3.20) £(>p) = >, p o = P(y p = 1). 

Man sieht, dab ^ P o hier die Losungswahrscheinlichkeit der Aufgabe p darstellt, 
welche in der klassischen Testtheorie (vgl. Lienert 1969, S. 87, od. Moosbrug- 
ger, 1981 b, S. 27) als Aufgabenschwierigkeit bezeichnet wird. 

Der Parameter £ p zeigt die „Trennscharfe“ einer Aufgabe an. Je groBer £ p ist, 
desto groBer der Zusammenhang (siehe Gleichung 3.14) zwischen Fahigkeit 
und Losung dieser Aufgabe, und desto weniger hangt das Losen der Aufgabe 
von anderen, nicht erfaBten Umstanden ab. 




Abb. 3.6: Linear traceline model. Die bedingte Wahrscheinlichkeit, daB die Variable y P 
den Wert 1 annimmt, ist eine lineare Funktion der Auspragung der latenten 
Variablen £. Man sieht, daB die bedingte Erwartung (Wahrscheinlichkeit) 
auch bei diskreten y P kontinuierlich ist. Wurde § normiert mit £(§) = 0, 
dann ist X p0 die unbedingte Wahrscheinlichkeit fiir „y P = 1“. Bei Fahigkeits- 
tests kann X p0 deshalb als „Leichtigkeit“ interpretiert werden. Der Parameter 
X p gibt den Wert an, urn den die Wahrscheinlichkeit fur „y p = 1” ansteigt, 
wenn sich £ um eine Einheit erhoht. Zugleich ist X p bei V(J;) = 1 die Kova- 
rianz zwischen y P und ^ (siehe Gleichung 3.14). In diesem Fall wurden 
willkiirlich X p0 = 0.5 und X p = 0.3 angenommen. 
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Weiterfuhrende Literatur: Lazarsfeld & Henry (1968) schreiben an mehreren Stellen 
ausfiihrlicher iiber das ..linear traceline model". Auch Fischer (1974. S. 160ff.) geht auf 
dieses Modell ein. Ein Anwendungsbeispiel findet man in Lazarsfeld (1959). Auch die 
polynomiale latent structure analysis von Lazarsfeld (1950) kann als Spezialfall der 
allgemeinen Theorie gemaB Gleichung 3.1 und Gleichung 3.3 dargestellt werden. 



3.3.3 ,, Latent profile-” und ..latent class model” 

Wir betrachten in diesem Abschnitt den Fall, daB es sich bei der latenten 
Variablen t; um eine zweiwertige Kodiervariable handelt, die nur die Werte 
,,Null“ oder ,,Eins“ annehmen kann und somit die Zugehorigkeit zu einer von 
zwei Klassen anzeigt. Die manifesten Variablen y p , p 6 { 1,2,. . .,P } , hingegen 
konnen kontinuierlich oder ebenfalls zweiwertig sein. Gibson (1959) nennt 
den ersten Fall ..latent profile model'*, auf den auch Lazarsfeld & Henry (1968. 
S. 228) sowie McDonald (1967, S. 58) eingehen. Der Fall, daB sowohl die 
latente Variable als auch die manifesten Variablen dichotom sind, ist unter der 
Bezeichnung ,, latent class model' 1 bekannt (vgl. Lazarsfeld & Henry, 1968, 
S. 17). Beide Modelle sind Spezialfalle der allgemeinen Theorie, die wir in 
Abschnitt 3.2 dargestellt haben, d.h. die beiden Modelle sind charakterisiert 
durch die Gleichungen 3.1 und 3.2 sowie die Festlegungen, daB beim ,, latent 
profile model" y p kontinuierlich fur alle p e { 1 , 2 ,. . . ,P } , und £ zweiwertig mit 
den Werten 0 oder 1 sind, wohingegen beini ..latent class model" sowohl y p als 
auch £ zweiwertig ist mit den Werten 0 oder 1, fur alle p 6 { 1 , 2, . . .P } . 

Wie man durch Berechnung der bedingten Erwartungswerte sehen kann, ver- 
einfacht sich in diesen Fallen der Parameter X p o zu 

(3.21) E(y p I £ = 0) = £(X p0 + kpg + £p 1 1 = o) = X p0 , 

(siehe Gleichung 3.6 und Anhang A, Regel 3), und im Fall manifester zwei- 
wertiger Variablen gilt 

(3.22) P(y p = 1 |£ = 0) = L p0 . 

Demnach ist also X p o der bedingte Erwartungswert von y p bzw. die bedingte 
Wahrscheinlichkeit fur ,,y p = 1“ im Fall £ = 0. Auf entsprechende Weise 
finden wir ftir im Fall kontinuierlicher manifester Variablen 

(3.23) E(y p | £ = 1) = E(k p o + L p £ + e p | ^ = 1) = X p0 + 

(siehe Gleichung 3.5 und Anhang A, Regel 3), und durch Einsetzen der Glei- 
chung 3.21 erhalten wir die Gleichung 

(3.24) L p = E(y p U = 1) - E(y p U = 0), 




Modelle zur Beschreibung statistischer Zusammenhange 



41 



die sich im Fall zweiwertiger manifester Variablen vereinfacht zu 
(3.25) k p = P(y p = 1 1 1 = 1 ) - P(y p = 1 1 1 = 0). 

Nach diesen Gleichungen ist k p im latent profile model gleich der Differenz der 
bedingten Erwartungswerte von y p unter = 1“ und = 0“ (siehe Abb. 3.7) 
bzw. im latent class model der Differenz der bedingten Wahrscheinlichkeiten 
filr „y P = 1“ unter = 1" und = 0“ (siehe Abb. 3.8). Ist k p gleich Null, so 
differenzieren die beiden latenten Klassen nicht hinsichtlich den betreffenden 
manifesten Variablen y P . 




Abb. 3.7: Latent profile model als Spezialfall der allgemeinen Theorie latenter Varia- 
blen mit linearer VC-Funktion gemaB Gleichung 3.2 sowie kontinuierlichen 
manifesten und dichtomer 0/1 kodierter latenten Variablen. Die bedingte 
Erwartung hat dann nur zwei Werte, namlich /. pC (hier 2) auf der Stufe £ - 0 
und kpo + k p (hier 2 + 3=5) auf der Stufe £ = 1. 



Die grundlegende Modellvorstellung der bedingten stochastischen Unabhan- 
gigkeit der y P (siehe Gleichung 3.1) bedeutet hier, daB innerhalb einer latenten 
Klasse die manifesten Variablen nicht korrelieren und auch in keiner Abhan- 
gigkeit hoherer Ordnung stehen (vgl. Beispiel 3.2.5). 
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>p 




/’O'p = > 1 1 = 1) 



Abb. 3.8: Latent class model als Spezialfall der allgemeinen Theorie latenter Variablen 
mit linearer VC-Funktion gemaB Gleichung 3.2 sowie dichotomen 0/1 ko- 
dierten manifesten und dichotomer 0/1 kodierter latenten Variablen. Die 
bedingte Erwartung hat dann nur zwei Werte, namlich die Wahrscheinlich- 
keiten fur y P = 1 auf der Stufe £ = 0, welche nach Gleichung 3.22 gleich X p o 
(hier 0.2) ist, sowie die Wahrscheinlichkeit fiir y P = 1 auf der Stufe £ = 1 
(hier 0.7). Die Differenz beider Wahrscheinlichkeiten beschreibt nach Glei- 
chung 3.25 der Parameter X p (hier 0.5). 



Bei einem Modell, bei dem eine dichotome latente Variable mit Null bzw. Eins 
kodiert wird, kann man die Standardisierung £(£) = 0 und V(£) = 1 nicht 
einfiihren, da diese beiden Kennwerte hier eine besondere Bedeutung haben, 
denn 

(3.26) £(£) = P(|= l) 
und 

(3.27) V(f) = P(£=l) • fl - P(£=l)] 

(siehe Anhang A, Gleichung A.l). 

Die Wahrscheinlichkeit, einer der beiden latenten Klassen anzugehoren, kann 
theoriegeleitet a priori festgelegt oder empirisch ermittelt werden, wenn man 
die Modellstrukturgleichung fiir das zentrale Moment dritter Ordnung zur 
Identifikation der Klassenwahrscheinlichkeiten P(£= 1) und P(^— 0) 0) benutzt. 
Naheres siehe Steyer & Moosbrugger, 1979, S. 38-41 sowie Lazarsfeld & 
Henry, 1968, S. 42. Ein illustratives Beispiel findet man in Lazarsfeld & Hen- 
ry (1968, S. 27ff.). 
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Weiterfuhrende Literatur: Das „latent class model" wird ausfuhrlich in Lazarsfeld & 
Henry (1968) behandelt. Einen kurzen Uberblick gibt Madansky (1978). Mit Proble- 
men der Parameterschatzung befassen sich Goodman (1974, 1979) und Formann (1978, 
1980 ). 



3.3.4 Logistische Modelle 



Bei dem in Abschnitt 3.3.2 dargestellten , .linear traceline model" muBten wir £ 
auf ein bestimmtes Intervall einschranken. Andernfalls konnte die bedingte 
Erwartung auch Werte groBer als Eins oder kleiner als Null annahmen (vgl. 
auch Wottawa, 1980, S. 49), welche mit der Wahrscheinlichkeitsinterpretation 
unvereinbar waren. Beim logistischen Testmodell von Birnbaum (1968) und 
dessen Spezialfall, dem dichotomen logistischen Testmodell von Rasch (1960) 
wird diesem Problem vorgebeugt, indent auBer der bedingten stochastischen 
Unabhangigkeit (siehe Gleichung 3.1) anstelle der linearen VC-Funktion (sie- 
he Gleichung 3.2) die logistische VC-Funktion (siehe Gleichung 3.4) ange- 
nonimen wird. Bei dichotomen manifesten Variablen y p mit den Werten 0 
bzw. 1 werden die Testmodelle ,,probabilistisch“ und als bedingte Erwartung 
erhalten wir folgende bedingte Wahrscheinlichkeit (vgl. Gleichung 3.4): 



(3.27) 



E(y^) = P(y p = l|D = 



exp (X. p0 + Xp|) 

1 + exp (X p0 + X p |) 



In der logistischen Modellgleichung 3.27 kommen zwei Parameter vor, die 
spezifisch fur die Variable y p sind; X, p beschreibt die ,,Steilheit“ der VC-Funk- 
tion, X. p o ihre Lokalisation entlang der £-Achse (vgl. Abbildung 3.4). In psy- 
chometrischen Anwendungen konnen wir ^ p als MaB ftir die Trennscharfe 
(,, discriminating power" sensu Birnbaum 1968, S. 409) einer Variablen auffas- 
sen und X. p o als ,,Leichtigkeit“. Anstelle von X, p o verwendet Birnbaum (1968, 
S. 409) einen Schwierigkeitsparameter X p0 , welcher nach Ausklammern von X p 
in Gleichung 3.27 und Setzen von ^ p0 /X p =- A, p0 gefunden wird. Die Modell- 
gleichung 3.27 lautet dann 

(3.28) E(y p U) = P(y p = l|D= ! + exp P [X p (| 




Der Schwierigkeitsparameter ^ p0 ermoglicht einen direkten Vergleich mit dem 
Personenparameter welcher bei Leistungstests zu besonders einfachen Para- 
meterinterpretationen fiihrt: Bezeichnet namlich § die ,,Fahigkeit“ einer Per- 
son in der latenten Variablen £ und X p o die Schwierigkeit der Aufgabe, so 
betragt wegen exp (0) = 1 dieLosungswahrscheinlichkeit P(y p = 1 | ^ = §) = 1/2, 
wenn c = A . p0 ist, namlich genau dann, wenn die Fahigkeit der Person ebenso 
groB wie die Schwierigkeit der Aufgabe ist. Bei positiv gewahlten X p gilt 
P(y p = = 5 ) > 1 / 2 , wenn § > X p0 und umgekehrt. 
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Ein interessanter Spezialfall des logistischen Testmodells und damit der allge- 
meinen Theorie latenter Variablen ist das dichotome logistische Testmodell von 
Rasch (1960), bei dem alle Parameter ^ p , p 6 { 1 ,2, . . . ,P } gleich Eins gesetzt 
werden. Das bedeutet, daB alle Variablen y P die latente Variable £ , .gleich gut“ 
messen sollen, aber auf im allgemeinen unterschiedlichem Schwierigkeits- 
niveau. Demnach verlaufen die VC-Funktionen der verschiedenen y P parallel, 
aber jeweils um die Differenz ihrer X p0 entlang der £-Achse verschoben. Abbil- 
dung 3.9 illustriert diesen Sachverhalt: 



y p 




Abb. 3.9: Dichotomes logistisches Testmodell nach Rasch (I960) als Spezialfall der 
allgemeinen Theorie latenter Variablen mit logistischer VC-Funktion ent- 
sprechend Gleichung 3.4 sowie dichotomen 0/1 kodierten manifesten und 
kontinuierlicher latenten Variablen. Die Kurven P(y p = l|£) geben fur jeden 
Wert S; der latenten Variablen £ die Wahrscheinlichkeit ftir die Auspragung 
y p = 1 an; bei psychometrischen Anwendungen ist das die ,,Losungswahr- 
scheinlichkeit” der Aufgabe p. Die VC-Funktionen der Aufgaben p = I und 
p = 2 haben gleiche ,,Trennscharfen“ (k t = X. 2 = I), aber unterschiedliche 
Schwierigkeiten k lc = -1.25 und X 20 = 2.0. Ihre Schwierigkeitsdifferenz 
betragt X 20 - ^10 = 3.25. Fur Personen mit § = = -1.25 erhalten wir bei 

Aufgabe 1 die Losungswahrscheinlichkeit 1/2 wie auch fur Personen mit £ = 
h ,2 = 2.0 bei Aufgabe 2. Mit der Wahl konstanter /. p ist auch die Varianz der 
latenten Variablen festgelegt. 



Die bei Modellgliltigkeit gleichen X p fur alle p 6 {1.2....P} Aufgaben ermbgli- 
chen ..spezifisch objektive“, d.h. aufgaben- bzw. personenstichprobenunab- 
hangige, Vergleiche (siehe z.B. Fischer, 1978, S. 299) zwischen Personen- 
bzw. Aufgabenparameter. 
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Weiterfiihrende Li teratu r: Als Weiterflihrung in deutscher Sprache konnen Fischer 
(1968, 1974), Rost & Spada (1978) sowie Wottawa (1980) angefiihrt werden. In engli- 
scher Sprache sei auBer Birnbaum (1968) und Lord & Novick (1968) auch das Heft 2 
des Bandes 14 (1977) des Journal of Educational Measurement genannt, in dem man 
neben einer Arbeit von Hambleton & Cook (1977) mehrere ein- und weiterfiihrende 
Beitrage zum Modell von Rasch und dem von Birnbaum findet. Ein Ubersichtsreferat 
gibt Fischer (1978). 



3.3.5 Klcissisches latent-additives Testmodell 

Ein weiteres psychometrisches Testmodell, welches sich als Erweiterung der 
klassischen Testtheorie versteht, namlich das ..Klassische latent-additive Test- 
modell“ (KLA-Modell, Moosbrugger & Muller 1981, 1982, Muller 1980) laBt 
sich als Spezialfall der allgemeinen Theorie latenter Variablen darstellen: die 
manifesten Variablen y p sind intervallskalierte Reaktionsvariablen, welche 
durch geeignete streng monotone Transformationen aus beobachtbaren konti- 
nuierlichen Testvariablen x p gewonnen werden. Der Zusammenhang zwischen 
den y p und der kontinuierlichen latenten Variablen 5 wird mit einer linearen 
VC-Funktion gemaB Gleichung 3.2 beschrieben, wobei fur alle Aufgaben X, p = 1 
gesetzt wird: 

(3.29) E(y p 1 g) = X p0 + 1 • l 

Ahnlich wie im Birnbaum-Modell (vgl. Abschnitt 3.3.4) wird anstelle des 
Leichtigkeitsparameters ein Schwierigkeitsparameter )i p0 = - ^ p0 benutzt, wel- 
cher wegen 

(3.30) E(§ | = 0) = - X p0 = Vo 

angibt (siehe Abbildung 3.10). in welchem Abstand vom Nullpunkt die VC- 
Funktion die |-Achse schneidet. Die KLA-Modellgleichung lautet dann in den 
hier verwendeten Ausdriicken 

(3.31) E(y p |g) = § - X' p0 . 

Der Personenparameter § und der Aufgabenparameter X p0 konnen wegen Glei- 
chung 3.30 auf einer Skala verglichen werden. 

Gilt J; > X p0 ist also die Merkmalsauspragung ^ einer Person groBer als die 
,,Schwierigkeit” der Aufgabe p, so wird eine positive Reaktion erwartet und 
umgekehrt eine negative Reaktion. 

Wegen der bei Modellgiiltigkeit gleichen filr alle p e {1,2,...,P} Aufgaben 
und der dann parallelen VC-Funktionen (vgl. Abbildung 3.10) weist auch das 
KLA-Modell die von Fischer (1974, S. 407) filr das Rasch-Modell (siehe Ab- 
schnitt 3.3.4) hervorgehobene Modelleigenschaft ,,spezifische Objektivitat“ 
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Abb. 3.10: Klassisches latent-additives Testmodell (Moosbrugger & Muller, 1981, 
1982) als Spezialfall der allgemeinen Theorie latenter Variablen mit linearer 
VC-Funktion entsprechend Gleichung 3.2 sowie kontinuierlichen manife- 
sten und kontinuierlicher latenten Variablen. Die Geraden E(y p | £) gemaB 
Gleichung 3.31 geben bei psychometrischen Anwendungen fur jeden Wert 
der latenten Variablen £ an, welche Reaktion y p erwartet wird. In jedem 
Item werden von jenen Personen positive Reaktionen erwartet, deren la- 
tente Merkmalsauspragung groBer ist als die entsprechende Itemschwierig- 
keit, z.B. wenn im 1. Item £ > = -2 gilt bzw. im 2. Item § > = 3. 

Da die VC-Funktionen aller Aufgaben gleiche Steigungen X p = 1 aufwei- 
sen, sind ,,spezifisch objektive Vergleiche“ zwischen Personen und Aufga- 
ben moglich. 



auf; es erlaubt, Schwierigkeitsunterschiede zwischen Aufgaben mit beliebigen 
Personen und Merkmalsunterschiede zwischen Personen mit beliebigen Items 
zu beurteilen. 

Weiterfiihrende Liter atur: Das KLA-Modell wurde von Moosbrugger & Muller (1980) 
hinsichtlich seiner wesentlichen Eigenschaften mit der klassischen Testtheorie und dem 
dichotomen logistischen Testmodell (siehe auch Abschnitt 3.3.4) verglichen. Zur Para- 
meterschatzung siehe Muller (1980); iiber geeignete Computeralgorithmen berichten 
Muller & Moosbrugger (1980). Mit empirischen Anwendungen befassen sich Moos- 
brugger (1982), Ruch & Hehl (1982) sowie Tarnai (1981). 
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3.4 Zusammenfassende Bemerkungen 

In diesem dritten Abschnitt haben wir eine formale Theorie vorgestellt, die 
beschreiben kann, wie beobachtbares Verhalten mit psychologischen Begrif- 
fen, Eigenschaften oder Konstrukten in Beziehung steht. Erst bei Vorliegen 
einer Theorie iiber die konkreten Beziehungen bestimmter psychologischer 
Konstrukte mit bestimmten beobachtbaren Variablen wird es sinnvoll, von 
diesen Konstrukten, Eigenschaften oder Begriffen zu sprechen. 

Eine mathematisch formulierte Theorie iiber den Zusammenhang zwischen 
beobachtbarem Verhalten und den psychologischen Konstrukten hat den Vor- 
teil groBerer Prazision und leichterer Uberpriifbarbeit. 

Die hier behandelte Theorie latenter Variablen basiert auf den Annahmen der 
bedingten stochastischen Unabhangigkeit und der Art der Variablencharakte- 
ristik. Dabei ist es unerheblich, ob die beteiligten Variablen kontinuierlich 
oder nur zweiwertig sind. Die Einschrankung auf eine einzige latente Variable 
wurde nur der Einfachheit halber gemacht. Theorien mit mehreren latenten 
Variablen erfordern jedoch einen groBeren mathematischen Aufwand, als wir 
in diesem Uberblick betreiben wollten. 



4. Anhange 
4.1 Anhang A: 

Regeln fur Erwartungswerte (vgl. Hays, 1973, S. 871ff.) 

Der E rw artu n gsw ert einer stochastischen Variablen oder Zufallsvariablen 
kann als eine mathematisch exakte Formulierung des umgangssprachlichen 
Begriffes des Durchschnittswertes angesehen werden. Im Fall einer diskreten 
Zufallsvariablen x mit den Werten x n kann man den Erwartungswert E ( X ) 
folgendermaBen definieren: 

(A.l) E{x)\ = £ x n ' P(x = x n ). 



Der Erwartungswert E(x) ist demnach die Summe der mit ihren Auftretens- 
wahrscheinlichkeiten gewichteten Werte x n der stochastischen Variablen x. Im 
Fall, daB die stochastische Variable N verschiedene Werte hat und jeder dieser 
Werte mit der Wahrscheinlichkeit 1/N auftritt, erhalt die Gleichung A.l die 
Form 



E(x) = 




I 



X 



n • 



(A.2) 



n=l 



l 

14 



n= 1 
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Im Fall, daB x kontinuierlich ist, definiert man E(x) mit Hilfe des Integrals 
(siehe Hays, 1973, S. 871 oder Bauer, 1974, S. 138, Steyer 1982, in diesem 
Band). 

Der Erwartungswertvektor eines stochastischen Spaltenvektors x = 
(x 1 ,...,Xq)’ ist dann einfach definiert durch 



(A.3) 



£(*): = 



E(x i) 

E(*q) 



Die wichtigsten Regeln ftir diese Konzepte sind im folgenden angegeben: 

Regel 1: Wenn a ein Vektor konstanter reeller Zahlen ist, dann gilt 

£(«) = a. 

Regel 2: Wenn a' ein Zeilenvektor konstanter reeller Zahlen und x ein stocha- 
stischer Vektor mit dem Erwartungswertvektor E(x) ist, dann gilt 

E(a’x) = a'E(x). 

Regel 3: Wenn a' und (i'Zeilenvektoren konstanter reeller Zahlen und x und y 
stochastische Vektoren mit den Erwartungswertvektoren E ( X ) und 
E(y) sind, dann gilt 
£( a'x + P'j) = a'E(x) + p 'E{y). 

Diese Regeln gelten entsprechend auch fiir skalare GroBen, welche als Vekto- 
ren mit einer Komponente aufgefaBt werden konnen. 



4.2 Anhang B: 

Regeln ftir Vakanzen und Kovarianzen 

Die Kovarianz zweier stochastischer Variablen oder Zufallsvariablen ist ein 
Parameter, der die Enge ihres linearen statistischen Zusammenhangs wider- 
spiegelt, d.h. sie gibt an. wie stark die beiden Variablen gemeinsam variieren. 
Die Kovarianz zweier stochastischer Variablen x und y, die wir mit C(x,y) 
symbolisieren, ist folgendermaBen definiert: 

(B.l) C(x,y) := £[[x - £(*)] • [y - £(»]]. 

Die Verallgemeinerung fiir mehrere stochastische Variablen ist die Kovarianz- 
matrix. Sind x bzw. y stochastische Spaltenvektoren mit Q bzw. P Komponen- 
ten, so ist deren Kovarianzmatrix C(x,y) wie folgt definiert: 
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E[[x - E(x)] \y - £(y)]'] = 




C(*\,y\) C(x 1 ,y 2 ) . 




■ C(x u y v ) 


C(x 2 ,yi) C(x 2 ,y 2 ) . 


• C(x 2 ,y p ) . 


■ C(x 2 ,y P ) 


C(x v yi) C(x q ,y 2 ) . 


• QWp) • 


. C(x q ,y P ) 


C(x Q ,y x ) C(x Q ,y 2 ) . 


. Qx:q,j p ) . 


. C(x Q ,y P ) 



Ein Kovarianzvektor ergibt sich, wenn einer der beiden stochastischen Vekto- 
ren nur eine Komponente enthalt. 1st z.B. Q=l, so reduziert sich die Kova- 
rianzmatrix C(x,y) auf den Kovarianzvektor 

(B.3) C ( x >y) = [C(x, yi ), C(x,y 2 ), . . . , C(x,y p ), . . . , C{x,y P )]. 

1st hingegen P = 1, so reduziert sie sich auf den Kovarianzvektor 



(B.4) 



C(x,y) = 



C(x u y) 

C(x 2 ,y) 

C(x q ,y) 

C(x Q ,y) 



Man beachte, daB C(x,y) = C(y,x)’ und C(y,x) = C(x,y)’ gelten. 

Im folgenden sind einige Regeln ftir diese Konzepte aufgefuhrt, die auch fiir 
die Varianz einer stochastischen Variablen von Bedeutung sind, da diese durch 

(B.5) V(x) := C(x,x) 

definiert ist. Bei alien stochastischen Variablen setzen wir im folgenden vor- 
aus, daB sie einen endlichen Erwartungswert haben. 



Regel 1: Sind a ein Vektor von reellen Konstanten und x ein stochastischer 
Vektor, dann gilt 
C(a, x) = 0. 

Regel 2: Wenn A 1; A 2 , Bj, B 2 Matrizen konstanter reeller Zahlen sind und x lf 
x 2 , y b y 2 stochastische Vektoren mit entsprechenden Anzahlen von 
Komponenten, dann gilt 

C(A,x, + A 2 x 2 , B j^i + B £y 2 ) = 

= B; + A iC(x u y 2 ) B 2 + A 2 C(x 2 ,yi) Bi + A 2 C(x 2 ,y 2 ) B 2 • 

Diese Regeln gelten entsprechend auch fiir skalare GroBen, welche als Vekto- 
ren mit einer Komponente aufgefaBt werden konnen. 
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4.3 Anhang C 

Regeln fur bedingte Erwartungen 

In diesem Anhang sind einige Rechenregeln fUr bedingte Erwartungen (vgl. 
Steyer, Moosbrugger & Ullrich 1981) zusammengestellt. Dabei sind x, y und z 
stochastische Variablen und x, y und z stochastische Vektoren auf dem glei- 
chen Wahrscheinlichkeitsraum sowie a, 6 reellwertige Konstanten und a, 6 
Vektoren reellwertiger Konstanten. 

Die bedingte Erwartung von y unter x, 

E(y\x) = E(y\xi,..., x Q ) 

ist eine stochastische Variable auf dem gemeinsamen Wahrscheinlichkeitsraum 
von x und y, deren Werte E(y |ac=x) die Erwartungswerte von y unter der 
Bedingung sind. daB der stochastische Vektor x einen bestimmten festen Wer- 
tevektor x angenommen hat (vgl. Feller, 1971 2 , S. 162). Fur bedingte Erwar- 
tungswerte E (y, AC =X )sind sinngemaB die gleichen Regeln wie fur unbedingte 
Erwartungswerte gliltig. 

Der Vektor der bedingten Erwartungen ist definiert durch 
(C.1) E(y\x) := [£(>, I *)> . ■ ■ ,E(y P | x)]'. 

Filr bedingte Erwartungen gelten folgende Regeln, die z.T. der Arbeit von 
Zimmermann (1975) entnommen sind. Die meisten davon gelten ,,nur“ mit 
Wahrscheinlichkeit 1. Auf diese Differenzierung verzichten wir jedoch in die- 
sem mehr an den Praktiker gerichteten Artikel. 

Regel 1: Der Erwartungswertvektor des Vektors der bedingten Erwartung 

von y unter x ist gleich dem Erwartungswertvektor von y: 
E[E(y\x)\ = E(y). 

Regel 2: Die bedingte Erwartung von x q , q 6 {1.....Q}, unter x = 

Xq)' ist gleich x q : 

E(Xq | X\> . . . ,Xq) Xq. 

Regel 3: Die bedingte Erwartung eines reellwertigen Konstantenvektors a 

unter x ist gleich a: 

£(a |ac) = a. 

Regel 4: Sind a und B reellwertige Konstantenvektoren sowie x und y sto- 

chastische Vektoren, so gilt flir die bedingte Erwartung von (t'x + 
P 'y unter z 

E(a'x+$'y\z) = a'E(x\z) + P'£Cy|z). 
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Regel 5: Alle Komponenten von x* seien auch in x enthalten. Dann gilt: Die 

bedingte Erwartung unter x* der bedingten Erwartung von y unter 
x ist gleich der bedingten Erwartung von y unter x* 

E[E(y\x) |x :; ‘] = E(y | x*) 

Regel 6: Die bedingte Erwartung des stochastischen Vektors x q y unter 

X],...,x Q ist gleich dem Produkt von x q mit der bedingten Erwar- 
tung von y unter x 1 ,...,Xq: 

E[x q • 3^ | -«i, . . . ,x Q ] = x q - E(y | x,, . . . ,x Q ). 

Regel 7: Der Erwartungswert der bedingten Erwartung der stochastischen 

Variablen 

p 

0 y P '■= y\ ■ ... ■ yp unter x ist gleich dem 

p=i p 

Erwartungswert von n Yp- 

P =i 

e =£(n4 

P =i P =i 

Regel 8: Der Erwartungswert des stochastischen Vektors x q • E(y |x) ist 

gleich dem Erwartungswertvektor von x q . y: 

E[x q • E(y I x u . . . ,x Q )] = £(x q • y) 

Regel 9: Der Erwartungswert des stochastischen Vektors y - E(y |x) ist 

gleich dem Nullvektor: 

E\y - E(y\x)] = 0. 

Regel 10: Der Vektor der bedingten Erwartungen des stochastischen Vektors 
\y ~ E(y | *)] unter x ist gleich dem Nullvektor: 

E[\y - E(y\x)] |x] = 0. 

Regel 11: Der Kovarianzvektor von x q und y - E(y \ X!,...,Xq) ist gleich dem 
Nullvektor 

C[x v y - £(y|x„...,x Q )] = O'. 

Regel 12: Der Erwartungswert des Produkts der bedingten Erwartungen 
zweier Zufallsvariablen z und y, beide unter x, ist gleich dem Er- 
wartungswert des Produkts der stochastischen Variablen z mit der 
bedingten Erwartung von y unter x und umgekehrt. 

E[E{z\x) ■ E{y\x)] = E [z ■ E(y |x)] = E[E(z\x) • y] . 
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Regel 13: Wenn a eine reellwertige Konstante sowie X[,...,x Q und y stocha- 
stische Variablen sind, dann gilt: 

E(y I Xi,...,x Q ) = a =► C(y, x q ) = 0, 
fur jedes q e {1,2, 

Diese Regeln gelten entsprechend auch fur skalare GroBen, welche als Vekto- 
ren mit einer Komponente aufgefaBt werden konnen. 
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2. Kapitel 



Modelle zur kausalen Erklarung 
statistischer Zusammenhange 

Rolf Steyer 



1. Einfiihrung 

1.1 Zur Bedeutsamkeit kausaler Abhangigkeit 

Statistische Modelle werden in der Psychologie und anderen Bio- und Sozial- 
wissenschaften nicht nur zur Beschreibung von Zusammenhangen der betrach- 
teten Phanomene verwendet, sondern wurden von Anfang an auch mit der 
Intention der kausalen Erklarung dieser Phanomene eingesetzt. So sollte z.B. 
Spearmans (1904. 1927) allgemeiner Intelligenzfaktor 1 ) die beobachtete Kova- 
riation der verschiedenen Intelligenzleistungen erklaren. Wright (1918, 1921, 
1923, 1934, 1960a, b) entwickelte seine pfadanalytischen Methoden explizit, 
um kausale Zusammenhange genetischer Phanomene zu beschreiben. Fishers 
(1925) varianzanalytische Verfahren dienten zunachst zur Auswertung land- 
wirtschaftswissenschaftlicher Experimente, bei denen er groBen Wert auf 
Kontrolltechniken wie z.B. Randomisierung gelegt hat (siehe z.B. 1947, S. 
17f.), und auch er spricht explizit von ,,Wirkungen“ (siehe z.B. 1956, S. 241) 
der experimentell manipulierten Variablen. 

In den Forschungsansatzen, die sich um die kausale Erklarung beobachtbarer 
Zusammenhange bemuhen, nehmen kontrollierte experimentelle und auch 
quasiexperimentelle Untersuchungen (vgl. z.B. Campbell & Stanley, 1963, 
Cook & Campbell, 1976, 1979) einen bevorzugten Platz ein. Ein groBer Teil 
der Techniken zur Versuchsplanung (siehe z.B. Bartenwerfer & Raatz, 1979, 
Henning & Muthig, 1979, McGuigan, 1978, Preiser, 1977, Schulz. Muthig & 
Koeppler, 1981, Zimmermann, 1972) zielt darauf ab, ,, interne Validitat“ her- 
zustellen, damit man tatsachlich den ,,EinfluB“ (Bredenkamp, 1969, S. 333) 
der unabhangigen auf die abhangigen Variablen feststellen kann. 



) Einen kurzen iiberblick iiber Spearmans Intelligenztheorie, und auch spatere Ent- 
wicklungen gibt z.B. Siillwold (1977). 
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Aber nicht nur in experimentellen Untersuchungen ist die Idee der kausalen 
Abhangigkeit von grundlegender Bedeutung. Auch in der Theorie latenter 
Variablen (vgl. z.B. Anderson, 1954, 1959, Gibson, 1959, 1962, Goodman, 
1974, 1978, 1979, Green, 1951, 1952, Harnerle, 1982, Joreskog, 1969, 1971, 
Lawley & Maxwell, 1971, Lazarsfeld & Henry, 1968, McDonald, 1962, 
1967a, b, Moosbrugger, 1982, in diesem Band), mit deren Hilfe man ebenfalls 
Zusammenhange beobachtbarer Variablen erklaren will, ist die ,,Idee der Ver- 
ursachung" (Lazarsfeld, 1959, S. 500) zentral. Dort will man wissen, ,,ob die 
zugrundeliegende Eigenschaft die Beziehungen zwischen den manifesten Indi- 
katoren erklart“ (Lazarsfeld, 1959, S. 501, Ubersetzung durch den Autor). 
Formann (1980, S. 107) schreibt dazu: ,,Manifeste Variablen kovariieren nicht 
deshalb, weil sie an sich miteinander zusammenhangen, sondern weil sie ihre 
gemeinsame Ursache in den latenten Variablen haben, welche es zu identifizie- 
ren gilt.“ 

Auch die Strukturgleichungsmodelle (vgl. z.B. Duncan, 1975, Goldberger & 
Duncan, 1973, Joreskog, 1970, 1973, 1974, Johnston, 1971, Malinvaud, 1970) 
werden explizit zur Beschreibung kausaler Zusammenhange verwendet, auch 
solcher mit wechselseitiger Abhangigkeit. Diese Modelle haben insbesondere 
durch neuere Arbeiten (siehe z.B. Bentler, 1980, Joreskog, 1977, 1978, 1979, 
Joreskog & Sorbom, 1976, 1977, 1979, 1981, Kenny, 1979) in letzter Zeit 
groBe Beachtung gefunden, die es u.a. ermoglichen, kausale Beziehungen auch 
zwischen latenten Variablen anzunehmen und solche Modelle empirisch zu 
iiberpriifen. 

Mit Modellen zur Erklarung statistischer Zusammenhange versucht man, Wir- 
kungsgefiige zu beschreiben, also kausale Theorien zu formulieren. Wlirde die 
Psychologie es bei der Beschreibung rein statistischer Zusammenhange bewen- 
den lassen, ware sie bestenfalls fur Prognosen zu gebrauchen. Dariiber hinaus 
sind jedoch in der Praxis oft Interventionen gefordert, deren Auswirkungen 
nur vorhersagbar sind, wenn kausale Theorien liber das Zusammenwirken der 
Variablen vorliegen. Brandstadter und Bernitzke (1976, S. 13) pladieren eben- 
falls fur eine verstarkte Forschung mit kausalen Modellen, indem sie schrei- 
ben: ..Psychologische Interventionen sind stets Eingriffe in ,,Systeme“, Ein- 
griffe in komplexe Wirkungsgefiige also, die erwartete und unerwartete, er- 
wiinschte und unerwiinschte Aus- und Nebenwirkungen haben konnen. Eine 
effiziente und risikobewuBte Interventionsplanung setzt eine moglichst umfas- 
sende Kenntnis des Wirkungsgefliges voraus, in das eingegriffen wird.“ 

Diese Wirkungsgefiige miissen keineswegs deterministischer Natur sein, viel- 
mehr muB man wohl in der Psychologie und selbst in vielen Bereichen der 
Physik von stochastischen GesetzmaBigkeiten ausgehen, worauf schon Sarris 
(1968) eindringlich hingewiesen hat. Dabei kann durchaus offenbleiben, ob 
wir zu stochastischen Gesetzen greifen, weil unser Wissen unvollstandig ist, in 
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dem Sinne, daB wir nicht alle beeinflussenden Variablen kennen, oder ob die 
untersuchten Phanomene an sich nichtdeterministisch sind. 



1.2 Zum Forschungsstand 

In krassem Gegensatz zu der Bedeutsamkeit des Konzepts der kausalen Ab- 
hangigkeit stand bisher allerdings die Verschwommenheit, die diesem wohl 
zentralen Begriff empirischer Forschung eigen ist. Dies liegt keineswegs daran, 
daB dem Thema ,kausale Abhangigkeit‘ nicht geniigend Aufmerksamkeit ge- 
schenkt wird. Vielmehr sind gerade die neueren Versuche, zu einer Klarung 
dieses Konzepts beizutragen, so zahlreich, daB es unmoglich erscheint, diese 
auch nur annahernd adaquat darzustellen. Versuche einer solchen Darstellung 
haben z.B. Bagozzi (1980), Cook & Campbell (1979), Stegmiiller (1969) und 
Suppes (1970) unternommen. In dieser Arbeit beschranken wir uns darauf, 
den Diskussionsstand in der Psychologie zu umreiBen. 

In der psychologischen Forschung konnen unter dem Aspekt kausaler Abhan- 
gigkeit wohl zwei Hauptstromungen unterschieden werden, die man vielleicht 
am besten mit den Etiketten ,experimentalpsychologische‘ vs. ,pfadanalytische 
Literatur 1 versehen kann. Der Experimentalpsychologe bemiiht sich. alle 
,Storvariablen‘ auszuschalten oder .interne Validitat 1 herzustellen, um den 
EinfluB der unabhangigen auf die abhangigen Variablen feststellen zu konnen. 
Dabei vermeiden manche Autoren, von kausaler Abhangigkeit zu sprechen. So 
z.B. Bredenkamp (1980, S. 1), wenn er formuliert: „Da der Begriff der Verur- 
sachung in der wissenschaftstheoretischen Literatur (vgl. Stegmiiller, 1969) 
jedoch anders als in diesem Zusammenhang gebraucht wird, soli das Ziel des 
Experimentierens darin gesehen werden, die Variation der abhangigen Varia- 
blen als Folge der Veranderung von unabhangigen Variablen eindeutig inter- 
pretieren zu konnen. “ 

Offensichtlich werden hier nur andere Worte fur Ursache und kausale Abhan- 
gigkeit eingesetzt, die jedoch keinerlei Zweifel daran aufkommen lassen, daB 
auch hier Ziel des Experimentierens ist, Ursache-Wirkungs-Beziehungen zu 
untersuchen, auch wenn der dabei verwendete Kausalbegriff nicht weiter ex- 
pliziert und mit anderen Bezeichnungen umschrieben wird. 

Andere Autoren sprechen in diesem Kontext explizit von kausaler Abhangig- 
keit und verstehen interne Validitat als Bedingung, unter der eine kausale 
Interpretation der gefundenen Abhangigkeiten moglich ist. So schreiben z.B. 
Cook & Campbell (1979, S. 58): ,, Interne Validitat ist, nach allem, mit den 
Gefahren befaBt, die Zweifel daran erwecken konnen, ob ein giiltiger kausaler 
Zusammenhang besteht, . . .“ (Ubersetzung durch den Autor). 
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Genau betrachtet, wird jedoch auch in dieser und ahnlichen Textstellen nur 
der eine undefinierte Begriff durch einen anderen ebenso undefinierten, nam- 
lich den der ,internen Validitat 1 ersetzt, und der EinfluB einer solchen Metho- 
dologie ware wohl gering geblieben, wenn nicht in der experimentellen Psy- 
chologie und Padagogik zugleich eine Reihe von Handlungsanweisungen ent- 
wickelt worden waren, die dazu beitragen, in einer empirischen Untersuchung 
.interne Validitat 1 herzustellen. Eine solche Handlungsanweisung ist z.B. die 
Kontrolltechnik der Randomisierung, bei der die Untersuchungseinheiten 
(z.B. Versuchspersonen) zufallig auf die experimentellen Gruppen aufgeteilt 
werden, so daB vor der experimentellen Behandlung keine systematischen 
Unterschiede zwischen den experimentellen Gruppen bestehen konnen, und 
es daher plausibel erscheint, die spiiter gefundenen Unterschiede auf die inzwi- 
schen durchgeflihrte experimentelle Behandlung zuriickzuftihren. Weitere sol- 
che Kontrolltechniken sind z.B. Konstanthaltung von potentiellen Storvaria- 
blen und Parallelisierung (vgl. z.B. Selg & Bauer, 1976. S. 5 8ff .). 



Obwohl diese Forschungsstrategien ohne Zweifel von groBer Bedeutung sind. 
bleibt jedoch ungeklart, ob sie hinreichend ftir eine kausale Interpretation von 
Abhangigkeiten sind, die unter solchen kontrollierten Bedingungen gefunden 
werden. Eine solche Klarung ist nur zu erhoffen, wenn eine von diesen Kon- 
trolltechniken zunachst unabhangige Definition kausaler Abhangigkeit vor- 
liegt. die deni Forschungsgegenstand der Psychologie und anderen Bio- und 
Sozialwissenschaften angemessen ist. 



Die zweite Richtung in der psychologischen Literatur wurde mit dem Etikett 
,Pfadanalyse‘ versehen. Vertreter dieser Methode sind der Auffassung, daB 
eine kausale Interpretation stochastischer Abhangigkeiten auch in nichtexperi- 
mentellen Forschungssituationen moglich ist, wenn man die Annahme der 
Geschlossenheit machen kann. So schreiben z.B. Namboodiri, Carter und 
Blalock (1975, S. 446): das theoretische System muB als theoretisch 

geschlossen oder komplett angenommen werden, bis auf strikt zufallige Feh- 
lerquellen in den Gleichungen.“ (Ubersetzung durch den Autor). Aber auch 
hier stellt sich die Frage, was man denn unter ,, geschlossen" verstehen soli, 
und was sind „strikt zufallige Fehlerquellen" ? Offenbar ist gemeint, daB alle 
wichtigen Variablen in der betreffenden Gleichung vorkommen. Aber was 
heiBt dann ,wichtig‘? Ist z. B. die abhangige Variable gemessen vor einer expe- 
rimentellen Behandlung - denn pfadanalytische Modelle sollten in experi- 
mentellen Situationen wohl erst recht gelten - eine wichtige Variable, da sie 
vermutlich eine hohe Korrelation mit der abhangigen Variablen gemessen nach 
der experimentellen Behandlung aufweist, oder ist sie vielleicht nur wichtig, 
wenn keine der Kontrolltechniken verwendet wurde, um ihren systematischen 
EinfluB auszuschalten? Wie kann gegebenenfalls die Annahme der Geschlos- 
senheit falsifiziert werden? 
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Obwohl die Theorien der pfadanalytischen Modelle weit entwickelt sind, was 
Schatz- und Testmethoden betrifft (siehe z.B. Goldberger, 1964, Heise, 1975, 
Joreskog & Sorbom, 1981, Lohmoller, 1981, Wold, 1981), ist in dieser Litera- 
tur keine befriedigende Definition kausaler Abhangigkeit zu finden, obwohl 
nicht wenige Versuche unternommen wurden (vgl. z.B. Simon, 1952, 1953, 
Wold, 1954, 1956, 1964, 1969). Einer der klarsten Definitionsvorschlage 
stammt von Blalock (1971b, S. 20): ,,Wir werden sagen. daB X eine direkte 
Ursache von Y ist (symbolisiert X — » Y) genau dann, wenn wir eine Verande- 
rung im Mittel von Y hervorbringen konnen, indem wir X verandern, wah- 
rend alle anderen Variablen konstant gehalten werden, die explizit in das Sy- 
stem einbezogen sind und die nicht von Y kausal abhangig sind.“ (Uberset- 
zung durch den Autor). 

Die m.E. wesentliche Schwache dieser Definition liegt darin, daB sie sich. 
genau wie Simons Versuche, nur auf ein willklirliches und zu enges Modell 
beziehen ,,- ein Gleichungssystem und nicht auf die ,,reale“ Welt, welche 
das Modell beschreiben soil" (Simon, 1953, S. 51, Ubersetzung durch den 
Autor). Bezieht man z.B. nur die Variablen X und Y in das Gleichungssystem 
ein, so ware Y - Blalocks Definition zufolge - immer von X kausal abhan- 
gig. da ja alle anderen Variablen (hier betragt deren Anzahl Null) konstant 
gehalten werden. Folglich ware Blalocks Aussage nur dann sinnvoll, wenn 
man die Geschlossenheitsannahme macht, daB namlich alle wichtigen Varia- 
blen im Gleichungssystem enthalten sind, eine Annahme, auf deren Unklar- 
heit bereits hingewiesen wurde. 

Dennoch enthalt Blalocks Definition wohl bereits die entscheidende Grund- 
idee, wenn man die Konstanzbedingung nicht auf die explizit einbezogenen 
Variablen beschrankt, sondern dabei alle potentiellen Storvariablen einbezieht. 
die in der betreffenden Situationsklasse explizit und implizit vorhanden sind. 
Ein sinnvolles Modell muB also in irgendeiner Form alle potentiellen Stor- 
variablen enthalten. Diese Grundidee und die daraus folgenden Konsequenzen 
sollen in dieser Arbeit expliziert und prazisiert werden. Dabei stellt sich her- 
aus, daB man unter bestimmten Voraussetzungen auch dann solche kausalen 
Abhangigkeiten feststellen kann, wenn nicht alle potentiellen Storvariablen 
konstant sind. 

Was Blalock und auch Simon offenbar ubersehen, ist vor allem, daB unser 
Modell nicht nur aus einem Gleichungssystem besteht, im einfachsten Fall also 
nicht nur aus einer Gleichung, welche die Beziehung zwischen zwei Variablen 
X und Y angibt. Vielmehr handelt es sich bei unserem Modell um eine formale 
Struktur, welche die gesamte Untersuchungssituationsklasse oder das gesamte 
Experiment mit alien darin vorkommenden Ereignissen beschreibt. Diese for- 
male Struktur wird mit bezeichnet und heiBt ,Wahrscheinlichkeits- 

raum‘. Dabei ist Q die Menge der in der betreffenden Untersuchungssituation 
vorkommenden Elementarereignisse, -^4 eine Sigmaalgebra daraus bildbarer 
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einfacher und zusammengesetzter Ereignisse, und P ist eine Funktion, die 
jedem dieser Ereignisse A £ eine feste Wahrscheinlichkeit zuordnet (siehe 
z.B. Bauer, 1974, S. 129). 

Indem jedem einfachen und zusammengesetzten Ereignis eine feste Wahr- 
scheinlichkeit zugeordnet ist, ist eine bestimmte Untersuchungssituationsklas- 
se oder ein Experiment charakterisiert. Dabei mussen diese Wahrscheinlich- 
keiten keineswegs bekannt sein. Vielmehr ist es u.a. ein Ziel empirischer Un- 
tersuchungen, zu datengestiitzten Schatzungen dieser Wahrscheinlichkeiten zu 
gelangen. 

Wenn nun auf einem solchen Wahrscheinlichkeitsraum, der eine ganz be- 
stimmte Untersuchungssituationsklasse reprasentiert, zwei stochastische Va- 
riablen X und Y definiert werden, so haben diese beiden Variablen eine ganz 
bestimmte Wahrscheinlichkeitsverteilung, die moglicherweise auch durch eine 
Gleichung') wie z.B. 

(1.2.1) Y y s a ro + a Yx X + F, mit F := Y — £(Y | X), 

beschrieben werden kann, wobei E(Y | X) die bedingte Erwartung von Y unter 
X, sowie Oyo und Otyx reelle Zahlen sind. Unser Modell, und das ist das 
Entscheidende, besteht aber nicht nur aus dieser Gleichung, wie viele Bucher 
der angewandten Statistik dem Leser nahelegen; vielmehr schlieBt dieses Mo- 
dell den gesamten Wahrscheinlichkeitsraum mit alien darin enthaltenen Ereig- 
nissen und deren Wahrscheinlichkeiten ein, und damit auch alle Variablen. die 
sich auf diesem Wahrscheinlichkeitsraum. in dieser Untersuchungssituations- 
klasse definieren lassen. In unserem gegenwartigen Kontext sind dabei vor 
allem diejenigen stochastischen Variablen W von Bedeutung, die der Experi- 
mentalpsychologe als ,Storvariablen‘ bezeichnet, und die er mit verschiedenen 
experimentellen Techniken zu kontrollieren bestrebt ist. So versucht man mit 
der Kontrolltechnik der Randomisierung zu erreichen, daB die unabhangige 
Variable X selbst stochastisch unabhangig von alien potentiellen Storvariablen 
ist. Dies dient ,,u.a. dem Zweck. den EinfluB anderer Faktoren, die diesen 
Zusammenhang (gemeint ist der zwischen X und Y, der Autor) modifizieren 
konnen, auszuschalten“ (Bredenkamp, 1980, S. 1). 

Das implizite Modell des Experimentalpsychologen besteht demnach nicht nur 
aus einer Gleichung, wie z.B. Gleichung 1.2.1, sondern aus einer Untersu- 
chungssituationsklasse, in der viele, auch unbekannte Variablen eine Rolle 



2 ) Das Zeichen ,=‘ in Gleichung 1.2.1 bedeutet .fast sicher gleich‘ oder mit .Wahr- 
scheinlichkeit Eins gleich‘, und ,:=‘ heifit .definitionsgemaB fast sicher gleich'. Die 
bedingte Erwartung E ( Y | X) ist in der Stochastik so definiert, daB Aussagen iiber sie 
nur ,mit Wahrscheinlichkeit Eins‘ oder .fast sicher 1 gelten. Somit werden bei solchen 
Aussagen .Ausnahmen 1 zugelassen, falls diese die Wahrscheinlichkeit Null haben (siehe 
Definition A. 5.1 im Anhang dieser Arbeit). 
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spielen, und deren Existenz durch eine sorgfaltige Wahl und Anwendung 
verschiedener Kontrolltechniken berlicksichtigt wird. Diese verschiedenen 
Variablen werden nicht einfach ignoriert, sondern die Untersuchungssitua- 
tionsklasse, das Experiment, wird nach Moglichkeit so gestaltet, daB die ande- 
ren Variablen nicht mehr den Zusammenhang zwischen X und Y modifizieren 
oder verfalschen konnen. Im Gegensatz zu Blalocks Vorstellungen spielen im 
Modell des Experimentalpsychologen also nicht nur die explizit genannten 
Variablen, im einfachsten Fall X und Y, eine Rolle, sondern die gesamte 
Untersuchungssituationsklasse mit alien darin beobachtbaren Variablen, auch 
wenn nicht alle diese Variablen tatsachlich beobachtet werden miissen. Mit 
anderen Worten ausgedriickt, das Modell des Experimentalpsychologen um- 
faBt den gesamten Wahrscheinlichkeitsraum, der das gesamte Experiment 
bzw. die gesamte Untersuchungssituationsklasse reprasentiert, mit alien dabei 
involvierten Ereignissen und Variablen. Die Gleichung zwischen zwei Varia- 
blen X und Y ist nur ein einziger von mehreren Bestandteilen seines Modells. 

Wenn ein solches Modell unsere Vorstellungen von deni beschreiben soil, was 
wir als ,Realitat‘ bezeichnen, muB ,kausal‘ nicht nur eine Eigenschaft des 
Modells, sondern auch als Eigenschaft dieser ,Realitat‘ postuliert werden; an- 
sonsten ware eine solche Modelleigenschaft wohl sinnlos. Demnach muB aber 
auch eine formale Eigenschaft definiert werden, die ein Modell zu einem kau- 
salen Modell macht, und in Anwendungen muB man wenigstens im Sinne von 
Poppers Falsifizierungskonzept (siehe z.B. Popper, 1969) uberprufen konnen, 
ob in dem betreffenden Fall diese Eigenschaft in der ,Realitat‘ erflillt ist. 

Diesen grundlegenden Forderungen entsprechen die bisherigen pfadanalyti- 
schen Arbeiten nicht. Die dort ublichen Modelltests priifen, ob das Modell mit 
den Daten vereinbar ist und vergleichen verschiedene alternative Modelle hin- 
sichtlich dieses Kriteriums. Sie testen jedoch nicht, ob ein solches Modell 
kausal interpretierbar ist. Es wird auch nicht angegeben, wie die Annahme der 
Geschlossenheit falsifiziert werden kann. 

Solche Mangel konnen wohl als mitverantwortlich fur viele skeptische Stim- 
men gegenuber ,Kausalanalysen‘ und dem Wort ,kausal‘ uberhaupt angesehen 
werden. Diese Stimmen reichen von Vorschlagen zur Umbenennung bis zur 
scheinbaren Ablehnung. Sarris z.B. schlagt in seiner Antwort auf Kraaks 
(1966) Pladoyer fur eine verstarkte Kausalforschung die Bezeichnung ,,stati- 
stisch-gesetzmaBige Dependenzen“ vor (Sarris, 1968, S. 184), womit er aber 
ebenfalls einen stochastischen Kausalbegriff meint. Herrmann (1969, S. 65) 
scheint einen vollig ablehnenden Standpunkt einzunehmen, wobei er dann 
aber die ,neue‘ ebenso diffuse Bezeichnung des ,.Bedingens“ (ebenda) heran- 
zieht, die wohl auch eher als Umbenennung zu verstehen ist, denn daB mit 
experimentellen Untersuchungen eben nicht nur rein statistische Zusammen- 
hange gefunden werden sollen, sondern qualitativ mehr als dies, bestreitet 
wohl gegenwartig niemand. Es stellt sich lediglich die Frage, wie diese andere 




66 



Rolf Steyer 



,Qualitat‘, die hier als kausale stochastische Abhangigkeit bezeichnet wird, zu 
definieren ist. Erst dann lassen sich experimentelle und nichtexperimentelle 
Forschungsstrategien auf einer soliden theoretischen Grundlage auf Vor- und 
Nachteile hin diskutieren, und in einer gemeinsamen Theorie integrieren. 



1.3 Uberblick 

Im vorliegenden Beitrag wird der Versuch unternommen, die oben aufgewor- 
fenen Probleme durch die Entwicklung einer formalen stochastischen Theorie 
zu losen, die zur Grundlegung sowohl experimenteller als auch nichtexperi- 
menteller Strategien der empirischen Kausalforschung herangezogen werden 
kann. Dabei beschranken wir uns auf regressiv lineare oder kurz ,reglineare‘ 
Modelle. Damit ist zwar eine Einschrankung auf relativ einfache Modelle ver- 
bunden, aber dennoch fallen unter diese Klasse eine recht grofie Zahl verschie- 
dener Spezialfalle. Neben den Regressionsmodellen im engeren Sinn, gehoren 
auch Varianz- und faktorenanalytische Modelle zur Klasse der reglinearen Mo- 
delle, wie Moosbrugger (1982, in diesem Band) zeigt. 

Die grundlegende Frage ist die nach dem Unterschied zwischen einem rein 
deskriptiven und einem explikativen, kausalen Modell, der nicht nur in der 
Intention des Anwenders, sondern auch in den formalen Eigenschaften des 
Modells seinen Niederschlag findet. Aufbauend auf den in der Experimentel- 
len Psychologie und Padagogik entwickelten Vorstellungen .interner Validi- 
tat', werden dabei die Bedingungen der Vorgeordnetheit und der Invarianz als 
die entscheidenden formalen Eigenschaften entwickelt, die uns ermoglichen, 
zwischen deskriptiven und explikativen reglinearen Abhangigkeiten aufgrund 
rein formaler Kriterien zu unterscheiden. 

Die Grundidee interner Validitat ist die einer idealen Situation, in der sich 
reine, unkonfundierte stochastische Abhangigkeiten zwischen den betrachteten 
Ereignissen oder Variablen zeigen. In einer solchen idealen Situation ist der 
EinfluB anderer Faktoren, die diese Abhangigkeiten modifizieren oder verfal- 
schen konnen, ausgeschaltet. Dies bedeutet jedoch nicht etwa, daB alle beein- 
flussenden Faktoren bekannt oder konstant sein miissen. Vielmehr sind ledig- 
lich die ,,konfundierenden Faktoren' 1 (Sarris, 1968, S. 183) fur die interne 
Validitat von Bedeutung, da sie die Beziehung zwischen den betrachteten 
Variablen verfalschen konnen. Andere beeinflussende Faktoren sind nur inso- 
fern wichtig, als sie die Beziehung zwischen den betrachteten Variablen mit 
Zufallsfehlern verschleiern, so daB wir die gesuchten Beziehungen mit unseren 
inferenzstatistischen Mitteln weniger leicht entdecken konnen. 

Die abstrakte Vorstellung einer in diesem Sinn ,validen‘ oder ,unkonfundier- 
ten* Beziehung zwischen zwei stochastischen Variablen (Zufallsvariablen) 
kann formal, d.h. ohne jeden Rekurs auf formal undefinierte Begriffe wie 
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.Experiment 1 , ,Zeit‘, .Manipulation 1 etc. formuliert werden (vgl. dagegen 
Wold, 1969, S. 448 f.). Der Prazisierung dieser Vorstellung zum Begriff einfa- 
cher kausaler reglinearer Abhangigkeit und den Folgerungen daraus sind die 
Abschnitte 3 bis 5 gewidmet, nachdem wir uns im zweiten Abschnitt anhand 
eines anschaulichen Beispiels mit konkretem Anschauungsmaterial ausgeriistet 
haben. In Abschnitt 6 wird dann wieder ein Beispiel behandelt, an dem dann in 
Abschnitt 7 Fragen des Geltungsbereichs oder der ,,externen Validitat 11 (siehe 
z.B. Campbell & Stanley, 1963) diskutiert werden konnen. 1m letzten Ab- 
schnitt wird schlieBlich in einer SchluBbetrachtung noch einmal die hier vorge- 
stellte Theorie in Hinsicht auf die sich aus ihr ergebenden praktischen Konse- 
quenzen fur die empirische experimentelle und nichtexperimentelle Kausalfor- 
schung zusammengefaBt. 

Obwohl es in diesem Beitrag nur um die Abhangigkeit zwischen zwei stocha- 
stischen Variablen geht, sind die hier entwickelten Ideen auch fur komplexere 
Modelle von Bedeutung. Indent man jeweils eine abhangige und eine unabhan- 
gige Variable bei Konstanz der anderen unabhangigen Variablen betrachtet, 
kann die Theorie einfacher kausaler reglinearer Abhangigkeit auch fur Mehr- 
variablenproblente zur Theorie direkter und totaler kausaler reglinearer Ab- 
hangigkeit fortgefiihrt werden (siehe Steyer, 1982). 

Einige weitere Worte zu deni, was in der vorliegenden Arbeit nicht behandelt 
wird, scheinen angebracht: In der gesamten Abhandlung werden keinerlei 
Stichprobenprobleme wie z.B. Hypothesen- und Modellbewertung behan- 
delt. Statt dessen untersuchen wir alle hier diskutierten Fragen gewissermaBen 
auf ,Populationsebene‘, d.h. wir verfahren so, als waren alle Parameter be- 
kannt und miiBten nicht erst aus einer Stichprobe geschatzt werden. Deswegen 
entstehen auch keinerlei statistische Entscheidungsprobleme zwischen ver- 
schiedenen Hypothesen liber die Parameter, Probleme, die in Anwendungsfal- 
len naturlich in der Regel vorhanden sind. Fur solche Stichprobenprobleme sei 
daher auBer auf die bereits genannten Arbeiten auf die einschlagigen Standard- 
werke zur multivariaten Statistik verwiesen, wie z.B. Ahrens (1968), Ander- 
son (1958), Bock (1975), Bortz (1977), Gaensslen und Schubo (1973), Krish- 
naiah (1980), Moosbrugger (1978), Rao (1973), Rasch (1976, 1978), Schach 
und Schafer (1978), Scheffe (1959), Searle (1971), Tatsuoka (1971), Timm 
(1975) und Winer (1971). 



2. Miinzen und Elektromagnet 
2.1 Einleitende Bemerkungen 



Bevor wir eine forntale Behandlung kausaler stochastischer Modelle in Angriff 
nehmen, soil zunachst an einent einfachen Beispiel eine solche kausale stocha- 
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stische Abhangigkeit beschrieben werden. Wir verfolgen dabei zwei Ziele. 
Zum einen wollen wir zeigen, daB deterministische Theorien kausaler Abhan- 
gigkeit nicht allgemein genug sind, um Abhangigkeiten zu beschreiben, die 
zwar intuitiv die Bezeichnung ,kausal‘ verdienen, aber dennoch nur stocha- 
stisch sind. Zum anderen soil an diesem Beispiel die formale Darstellung in den 
spateren Abschnitten veranschaulicht und die zentrale Frage nach dem forma- 
len Unterschied zwischen einem kausalen und einem nichtkausalen Regres- 
sionsmodell erlautert werden. 



2.2 Beschreibung des Beispiels 

Das Beispiel besteht aus folgendem Gedankenexperiment: Wir betrachten eine 
Mttnze I und eine Mlinze II. die auf jeweils einer Seite aus Plastik und auf der 
anderen jeweils aus Metall bestehen. Mit diesen Miinzen stellen wir uns einen 
Versuch vor, der folgendermaBen aussieht: Zuerst wird Mlinze II, danach 
Mlinze I geworfen, und zwar auf eine Platte, welche die Eigenschaften eines 
ein- und ausschaltbaren Elektromagneten besitzt. 



Tabelle 2.2.1: Erste Situationsklasse: Der Elektromagnet ist ausgeschaltet. 

wahrend die beiden Miinzen geworfen werden. Die Ergebnisse 
des Werfens der Miinzen 1 und II sind bedingt stochastisch 
unabhangig (siehe Gleichung 2.2.4). Bei den angegebenen Zah- 
len handelt es sich um bedingte Wahrscheinlichkeiten gegeben 
das Ereignis A, daB der Elektromagnet ausgeschaltet ist. 







Miinze II fallt auf 








Metallseite C 


Plastikseite C 




Mttnze I 

fallt 

auf 


Metallseite B 


0.25 


0.25 


0.50 


Plastikseite B 


0.25 


0.25 


0.50 




0.50 


0.50 


1.00 



1. Situationsklasse: Der Elektromagnet ist ausgeschaltet. In der ersten Situa- 
tionsklasse wird der Versuch: , Zuerst Mttnze II, danach Mttnze 1 werfen‘ 
einmal durchgeftthrt, und zwar dann, wenn der Elektromagnet ausgeschaltet 
ist. Wir nehmen dabei der Einfachheit halber an, daB es sich um zwei bezttg- 
lich ihrer physikalischen Eigenschaften gleiche Miinzen handelt, insofern als 
beide mit einer Wahrscheinlichkeit von 0.5 auf die Metall- bzw. Plastikseite 
fallen. Wenn der Elektromagnet aus ist, sind unserer intuitiven Theorie zufol- 
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ge die Ergebnisse des Werfens beider Mtinzen sowohl stochastisch als auch 
kausal voneinander unabhangig. Betrachten wir z.B. die Ereignisse 

(2.2.1) B := Miinze I fallt auf die Metallseite. 
und 

(2.2.2) C := Miinze II fallt auf die Metallseite, 

so erhalten wir demnach die bedingte Wahrscheinlichkeit, daB beide Mttnzen 
auf die Metallseite fallen gegeben das Ereignis 

(2.2.3) A := der Elektromagnet ist ausgeschaltet, 
ilber die Gleichung 

(2.2.4) P( Bnc I A) = P( B I A) • P( C I A) = 0.5 • 0.5 = 0.25 

(siehe Tabelle 2.2.1). Die angegebenen Wahrscheinlichkeiten kann man sich als 
relative Haufigkeiten einer Versuchsreihe vorstellen, bei der die einzelnen Ver- 
suche, .zuerst Miinze II, danach Miinze I werfen 1 . sehr oft durchgefiihrt wur- 
den. Nachdem diese Wahrscheinlichkeiten einmal bekannt sind, charakterisie- 
ren sie jedoch auch jeden einzelnen Versuch 3 ). 



Tabelle 2.2.2: Zweite Situationsklasse: Der Elektromagnet ist angeschaltet. 

wahrend die beiden Mttnzen geworfen werden. Die Ergebnisse 
des Werfens der Mttnzen I und II sind auch hier bedingt sto- 
chastisch unabhangig (siehe Gleichung 2.2.6), lediglich die be- 
dingten Randwahrscheinlichkeiten sind gegenttber Tabelle 
2.2.1 verandert (z.B. 0.9 statt 0.5). Die angegebenen Zahlen 
sind bedingte Wahrscheinlichkeiten gegeben das Ereignis A, 
daB der Elektromagnet angeschaltet ist. 







Miinze II 


fallt auf 








Metallseite C 


Plastikseite C 




Miinze I 

fallt 

auf 


Metallseite B 


0.81 


0.09 


0.90 


Plastikseite B 


0.09 


0.01 


0.10 




0.90 


0.10 


1.00 



3 ) Vergleiche zur Interpretation des Wahrscheinlichkeitsbegriffs z.B. Bunge, 1967, 
S. 423f„ Popper, 1959, oder Stegmttller, 1973, S. 129. 
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2. Situationsklasse: Der Elektromagnet ist angeschaltet. Die zweite Situations- 
klasse unterscheidet sich von der ersten dadurch, daB der Elektromagnet ange- 
schaltet ist, wahrend die beiden Mttnzen geworfen werden. Dies hat zur Folge, 
daB die bedingte Wahrscheinlichkeit gegeben 

(2.2.5) A := der Elektromagnet ist angeschaltet. 

fiir beide Mttnzen auf die Metallseite zu fallen erhoht ist, und zwar, wie wir 
annehmen, auf 0.9. DemgemaB ist nun 0.1 die bedingte Wahrscheinlichkeit fttr 
beide Mttnzen, auf die Plastikseite zu fallen. Auch in dieser Situationsklasse 
sind die Ergebnisse des Werfens beider Mttnzen sowohl statistisch, als unserer 
intuitiven Vorstellung zufolge, auch kausal voneinander unabhangig, und ent- 
sprechend finden wir auch hier z.B. die Wahrscheinlichkeit dafttr, daB beide 
Mttnzen auf die Metallseite fallen durch die Multiplikation der einzelnen be- 
dingten Wahrscheinlichkeiten, also 

(2.2.6) P(BflC I A) = 7>(B | A) • P{ C | A) = 0.9 • 0.9 = 0.81 

(siehe Tabelle 2.2.2). 

Tabelle 2.2.3: Dritte Situationsklasse: Der Elektromagnet ist mit Wahrschein- 
lichkeit 0.5 an- bzw. ausgeschaltet, wahrend die beiden Mttn- 
zen geworfen werden. Die Ergebnisse des Werfens der Mttnzen 
I und II sind nicht stochastisch unabhangig (siehe Ungleichung 
2.2.7). Bei den angegebenen Zahlen handelt es sich um unbe- 
dingte Wahrscheinlichkeiten. 







Mttnze 11 


fallt auf 








Metallseite C 


Plastikseite C 




Mttnze I 

fallt 

auf 


Metallseite B 


0.53 


0.17 


0.70 


Plastikseite B 


0.17 


0.13 


0.30 




0.70 


0.30 


1.00 



3. Situationsklasse: Der Elektromagnet ist mit Wahrscheinlichkeit 0.5 an- oder 
ausgeschaltet. Die dritte Situationsklasse besteht darin, daB der Versuch ,Zu- 
erst Mttnze II, danach Mttnze I werfen‘ unter der Bedingung durchgefuhrt 
wird, daB der Zustand des Elektromagneten unbekannt, und dabei aber mit 
Wahrscheinlichkeit 0.5 an- oder ausgeschaltet ist, wahrend die beiden Mttnzen 
geworfen werden. Die fttr diese Situationsklasse angegebenen Wahrscheinlich- 
keiten ergeben sich hier als Mittel der entsprechenden bedingten Wahrschein- 
lichkeiten in den ersten beiden Situationsklassen. 
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In dieser dritten Situationsklasse ist ein stochastischer Zusammenhang zwi- 
schen den Ergebnissen des Werfens der Mttnze I und denen des Werfens der 
Milnze II festzustellen. Dabei sind die Miinzwurfergebnisse zwar stochastisch 
(siehe Tabelle 2.2.3), unserer intuitiven Vorstellung zufolge aber nicht kausal 
voneinander abhangig. Statt dessen sind die Ergebnisse des Werfens der beiden 
Miinzen vom Zustand des Elektromagneten kausal stochastisch abhangig. Ist 
der Elektromagnet namlich an, so fallen die beiden Miinzen eher auf die Me- 
tallseite, und ist er aus, so fallen sie mit unveranderter Wahrscheinlichkeit auf 
die Metallseite. Variiert der Zustand des Elektromagneten, wie in dieser drit- 
ten Situationsklasse. so kommt auf diese Weise auch eine Kovariation der 
Munzwurfereignisse zustande. Diese stochastische Abhangigkeit auBert sich 
darin, daB nun anstelle der Gleichungen 2.2.4 oder 2.2.6 die Ungleichung 

(2.2.7) P(BDC) = 0.53 # P(B) ■ P( C) = 0.7 • 0.7 = 0.49 

gilt. 

Das hier beschriebene Beispiel 4 ) .Miinzen und Elektromagnet 1 ist in verschie- 
dener Hinsicht fiir die in dieser Arbeit behandelte Thematik von Interesse, 
denn es kommen sowohl nichtkausale als auch kausale stochastische Abhan- 
gigkeiten vor, namlich nichtkausale stochastische Abhangigkeiten zwischen 
den Miinzwurfereignissen, und kausale stochastische Abhangigkeiten jeweils 
eines Miinzwurfereignisses vom Zustand des Elektromagneten. 1st dieser nam- 
lich an, so erhohen sich die bedingten Wahrscheinlichkeiten, fiir jede der 
beiden Miinzen auf die Metallseite zu fallen von 0.5 auf 0.9, und offenbar 
konnen wir mit dem Elektromagneten diese Wahrscheinlichkeiten steuern, 
obwohl keine deterministische Abhangigkeit der Miinzwurfereignisse vom Zu- 
stand des Elektromagneten vorliegt (vgl. zum Handlungsaspekt des Kausalbe- 
griffs auch von Wright, 1974). 

Um ein analoges Beispiel aus der Psychologie zu erhalten, brauchen wir ledig- 
lich an die Stelle der beiden Miinzen zwei Versuchspersonen zu setzen, die 
z.B. auf einen akustischen Reiz mit ,,ja, ich hore“ bzw. ,,nein, ich hore nicht 11 
antworten. Die Stelle des Elektromagneten nimmt dann der akustische Reiz 
ein, der in zwei Auspragungen dargeboten wird. 



4 ) Ein von der formalen Struktur analoges Beispiel findet sich in Lazarsfeld und Henry 
(1968, S. 17). Anstelle der beiden Miinzen I und II handelt es sich dort um zwei 
Zeitschriften A und B, die von den befragten Personen gelesen Oder nicht gelesen 
werden, was dem Fallen der Miinzen auf die Metall- bzw. Plasti kseite entspricht, und 
an die Stelle des Elektromagneten, der die stochastischen Abhangigkeiten zwischen den 
Miinzwurfereignissen verursacht, tritt die latente Variable „hoher vs. niedriger Ausbil- 
dungsstand", welche die Kovariation des Lesens der beiden Zeitschriften herbeifuhrt. 
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2.3 Abhangigkeit der ersten von der zweiten Miinzvariablen 



Wir formulieren nun die in der dritten Situationsklasse (siehe Tabelle 2.2.3) 5 ) 
festzustellende stochastische Abhangigkeit des Ergebnisses des Werfens der 
Mttnze I von dem Ergebnis des zuerst erfolgenden Werfens der Miinze II. 
wobei wir bewuBt den Elektromagneten ignorieren. Die Abhangigkeit dieser 
Mttnzwurfergebnisse lafit sich als reglineare Abhangigkeit wie folgt beschrei- 
ben: Wir nehmen an, daB der Wahrscheinlichkeitsraum (Q ,*=A,P) die dritte 
Situationsklasse reprasentiert und definieren die beiden Miinzvariablen 



(2.3.1) 

(2.3.2) 



j 1, wenn die Miinze I auf die Metallseite, 
[0, wenn sie auf die Plastikseite fallt, 

J 1 , wenn die Miinze II auf die Metallseite. 
[0, wenn sie auf die Plastikseite fallt. 



und das Ereignis 



(2.3.3) B := {(0 € Q: Z,(to) - 1}, 



daB die Miinze I auf die Metallseite fallt. Fur die Beziehung der beiden Miinz- 
variablen gilt dann die Gleichung 6 ) 

(2.3.4) £(Z t | Z„) = |3, 0 + (3 12 Z n, 

wobei (3,o und (3,2 reellwertige Konstanten sind. Aus dieser Gleichung folgen, 
unter Benutzung der Gleichungen A. 5. 2, A. 4. 6 und A. 4.3 des Anhangs 

(2.3.5) £(Z,|Z II =1) = />(B|Z„=1) = (3 ]0 + (3,2 
und 

(2.3.6) E{ Zi I Z„=0) = P( B I Z„=0) - (3,0 - 0.17/0.3 - 0.5666 

(siehe Tabelle 2.2.3). Demnach ist also (3, 0 bei diesem Beispiel als bedingte 
Wahrscheinlichkeit fiir B zu interpretieren, unter der Bedingung namlich, daB 
Z H = 0 ist. Fiir (3,2 gilt dann gemaB den Gleichungen 2.3.5 und 2.3.6 

(2.3.7) ( 3,2 = £(B | Zn=l) - P(B|Z„=0) = 

= 0.53/0.7 - 0.5666 = 0.1905 



(siehe wiederum Tabelle 2.2.3). Auf analoge Weise konnen wir auch die Para- 
meter fiir die Gleichung 



5 ) Bei Referenzen mit drei Ziffern geben die ersten beiden Ziffern immer den Abschnitt 
an. 

6 ) Man beachtedie FuBnotezur Gleichung 1.2.1. 
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(2.3.8) E(Z U | Zj) -jj- (3 2 o + P 21 Zt\ 

berechnen, welche die stochastische Abhangigkeit der zweiten von der ersten 
Miinzvariablen angibt. Dabei erhalten wir (3 2 o = 0.5666 und |3 21 = 0.1905. 

Die stochastischen Variablen Z x und Z u sind nach dem Gesichtspunkt der 
Handlungsabfolge geordnet, da zuerst die Miinze II und dann die Miinze 1 
geworfen wird. Dennoch wilrde es unserer Intuition widersprechen, |3 12 kausal 
zu interpretieren, nur weil Z n der Variablen Z x vorgeordnet ist. Statt dessen 
handelt es sich bei Pi 2 um einen Koeffizienten, der eine nichtkausale reglineare 
Abhangigkeit beschreibt, bei der Z u der Variablen Z x durch die festgelegte 
Handlungsabfolge (zuerst Miinze II, dann Miinze I werfen) vorgeordnet ist. 
Die zeitliche Vorgeordnetheit der Variablen ist demnach keine hinreichende 
Bedingung daflir, dafi eine bestehende stochastische Abhangigkeit auch kausal 
zu interpretieren ist (vgl. z.B. Zimmermann, 1972, S. 40, aber auch z.B. 
Granger, 1969, 1973, Hosoya, 1977 und Pierce & Haugh, 1977). 



2.4 Abhangigkeit der Miinz- von der Magnetvariablen 

Die in der dritten Situationsklasse bestehende stochastische Abhangigkeit zwi- 
schen den beiden Miinzvariablen laBt sich kausal durch die Variation des Zu- 
stands des Elektromagneten erklaren. Offenbar handelt es sich um eine kausale 
Abhangigkeit, die stochastischer Art ist, womit allerdings nicht in Frage ge- 
stellt werden soil, daB es prinzipiell moglich ist, die Mlinzwurfergebnisse 
deterministisch zu erklaren. Allerdings ware eine solche Theorie weitaus kom- 
plexer und schwerer anzuwenden, als die hier behandelte stochastische Theo- 
rie, da nicht nur der Zustand des Elektromagneten bekannt sein miiBte, son- 
dern auch die Drehgeschwindigkeit der Miinzen in alien drei Dimensionen des 
Raumes, die Wurfhohe etc. 

Fill' die hier zu besprechende stochastische Theorie benotigen wir lediglich 
noch die Magnetvariable 

Z J b wenn der Elektromagnet an- 
M [0, wenn er ausgeschaltet ist. 

Die Abhangigkeiten der Miinzvariablen Z x von Z u und der Magnetvariablen 
Z M sowie der Variablen Z u von Z M lassen sich durch die beiden Gleichungen 

(2.4.2) E ( Zj | Z n ,Z M ) = P(B | Z n ,Z M ) = 

= a 10 + a 12 Z n + a 13 Z M = 0.5 + 0-Z n + 0.4-Z M 

und 



(2.4.3) 



E(Zh I Z M ) P ( C Z M ) a 20 + a 23 Z M — 0.5 + 0.4-Z : 
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beschreiben, wobei B das Ereignis ist, daB die Mttnze I auf die Metallseite fallt, 
und 

(2.4.4) C := {to e Q: Z„(u)) = 1} 

das Ereignis ist, daB die Miinze II auf die Metallseite fallt. 

Die numerischen Werte der in diesen Gleichungen vorkommenden Koeffizienten kon- 
nen aufgrund folgender Uberlegungen berechnet werden: Aus den beiden Gleichungen 
2.4.2 und 2.4.3 folgen nach den Gleichungen A.5.2, A.4.6 und A.4.3 des Anhangs 



(2.4.5) 
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(2.4.6) 
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(2.4.9) 
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0.5 = 


= 0.4, 





wobei die in den Tabellen 2.2.1 bis 2.2.3 angegebenen Wahrscheinlichkeiten zugrunde- 
liegen. 

Aus den Gleichungen 2.4.2 und 2.4.3 lassen sich mit den in den Gleichungen 
2.4.5 bis 2.4.9 angegebenen Koeffizienten die stochastischen Abhiingigkeiten 
zwischen Z x und Z n ableiten, und in diesem Sinn erklaren, denn sie implizieren 
die folgende Gleichung fur die Kovarianz der Variablen Z t und Z n : 

(2.4.10) C(Z I; Zi,) = C[(a 10 + a 13 Z M + F^, (a 20 + a 23 Z M + F„)], 
mit 

(2.4.11) F, := Zj — E(Zi | Z M ) 
und 

(2.4.12) Fn := Z n — £(Z n | Z M ). 

Die Kovarianz dieser beiden Residualvariablen mit Z M ist jeweils Null (siehe 
die Gleichungen A. 5. 8 und A. 5. 13): 

(2.4.13) C(Fj,Z m ) = C(Fn,Z M ) = C(Fi,Fn) = 0, 

und das gleiche gilt wegen £(Fi | Z n ,Z M ) = 0 und Gleichung A. 5. 12 auch flir 
die Kovarianz untereinander, was aus den Theoremen A.5.2. und A. 5. 4 folgt. 

Nach den Gleichungen A. 3. 2, A. 3. 4 und A. 3. 5 folgt daher die Kovarianz- 
strukturgleichung 
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(2.4.14) C(Zi,Zn) — a 13 C(Zm,Z m ) a 23 — Up V(Z Iv j) ct 23 — 

= 0.4-0. 25-0. 4 = 0. 04. 

Dabei haben wir dieVarianz V(Z M )unter Benutzung von E(Z M ) = P(A) = 0.5 
berechnet (siehe die Gleichungen A. 3.2 und A.2.3 und Tabelle 2.2.3), wobei A 
das Ereignis ist, daR der Elektromagnet angeschaltet ist. 

Gleichung 2.4.14 entspricht dem sogenannten Grundtheorem der Pfadanalyse (siehe 
z.B. Seibel & Nygreen, 1972, S. 7 Oder Wright, 1934, S. 163). Der einzigellnterschied 
besteht darin, daB bei Wright nicht die Kovarianzen, sondern die Korrelationen zu- 
grunde gelegt werden. Gleichung 2.4.14 ist jedoch keine besondere Eigenschaft kausa- 
ler Modelle, wie man manche Autoren (vgl. z.B. Hummell & Ziegler, 1976b, S. E 
61 ff.) verstehen konnte, da sie bereits aus den Gleichungen 2.4.2 und 2.4.3 folgt. 

C(F|,F M ) = 0 besagt, daB die Erklarung der Kovarianz von Z, und Z M durch die 
Gleichungen 2.4.2 und 2.4.3 perfekt ist. Dies kann jedoch nicht als Kriterium 
fur die kausale Interpretierbarkeit der durch die Gleichungen 2.4.2 und 2.4.3 
beschriebenen Abhangigkeiten herangezogen werden. Wurden wir namlich 
nur die Munze II werfen, dann wurde Gleichung 2.4.3 immer noch die kausale 
Abhangigkeit der Munzvariablen Z M von der Magnetvariablen Z M beschreiben, 
obwohl dann gar keine Kovarianz C(F|,F M ) vorkame. 

Die auf die oben beschriebene Weise ohne zusatzliche Annahmen aus den 
Gleichungen 2.4.2 und 2.4.3 abgeleitete Kovarianz zwischen Z, und Z M stimmt 
exakt mit derjenigen Kovarianz fur diese beiden Variablen uberein, die wir 
direkt aus den Daten der Tabelle 2.2.3 berechnen konnen. 

Die Kovarianz zwischen zwei stochastischen Variablen X und Y mit den Erwartungs- 
werten E(X) und E(Y) ist definiert durch 

(2.4.15) C(X,Y) := £([X - £(X)J • [Y - £(Y)]). 

Daraus und aus der fur eine diskrete stochastische Variable Z mit Erwartungswert E(Z) 
und den Werten z, gultigen Definitionsgleichung A.2.3 des Anhangs fur den Erwar- 
tungswert berechnen wir nun die Kovarianz C(Z|,Z M ). Wenden wir die Gleichung 
A.2.3 auf das in Gleichung 2.4.15 vorkommende Produkt [X - £(X)] ■ [Y - £(Y)] an, 
so erhalten wir 

(2.4.16) C(Z b Z„) = (1 - 0.7) ■ (1 - 0.7) ■ £(BnC) + 

+ (1 - 0.7) • (0 - 0.7) • £(BnC) + 

+ (0 - 0.7) ■ (1 - 0.7) ■ £(BnC) + 

+ (0 - 0.7) ■ (0 - 0.7) ■ P(BnC) = 

= 0.09 ■ 0.53 + (-0.21) ■ 0.17 + 

+ (-0.21) ■ 0.17 + 0.49 • 0.13 = 

= 0.04. 

Da die beiden Variablen nur zwei Werte annehmen konnen, ist mit der Kova- 
rianz die gesamte stochastische Abhangigkeit zwischen den beiden Munzvaria- 
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blen Z] und Z n beschrieben. Sie ist in diesem Sinn durch die in den Gleichun- 
gen 2.4.2 und 2.4.3 beschriebene Abhangigkeit dieser beiden Variablen von 
der Magnetvariablen Z M erklart. 

2.5 Das Problem 

Unserer Intuition gemaB sind die Koeffizienten (* 23 , Ot^ und aus den Glei- 
chungen 2.4.2 bzw. 2.4.3, welche die Abhangigkeiten der Miinz- von der 
Magnetvariablen beschreiben, kausal zu interpretieren. Es stellt sich nun je- 
doch die Frage, welches eigentlich die formalen Unterschiede zwischen der 
hier vorliegenden kausalen Abhangigkeit der Miinz- von der Magnetvariablen 
und der durch Gleichung 2.3.4 beschriebenen nichtkausalen reglinearen Ab- 
hangigkeit der Munzvariablen Z : von der Munzvariablen Z H ist. In beiden 
Fallen liegen korrekte Regressionsgleichungen 7 ) vor, aber dennoch beschreibt 
die eine unserer Intuition nach nur eine nichtkausale, die andere hingegen eine 
kausale reglineare Abhangigkeit. 

Das in der experimentellen psychologischen und padagogischen Forschung 
hierfiir entwickelte Kriterium ist das der ,internen Validitat 1 , welches im nach- 
folgenden Abschnitt behandelt werden soil. 

2.6 Zusammenfassende Bemerkungen 

In diesem Kapitel wurde ein Beispiel behandelt, in dem sowohl intuitiv kausale 
als auch nichtkausale Abhangigkeiten vorkommen, die erstens alle nichtdeter- 
ministisch sind, und sich zweitens alle durch eine Regressionsgleichung kor- 
rekt beschreiben lassen. Es wurde gezeigt, daB weder diese Beschreibbarkeit 
durch eine Regressionsgleichung, noch eine zeitliche Geordnetheit der Varia- 
blen ein hinreichendes Kriterium zur Unterscheidung der kausalen von der 
nichtkausalen Abhangigkeit sein kann. Somit ist die Frage aufgeworfen, wel- 
che Bedingung als ein solches hinreichendes Kriterium fur eine kausale Inter- 
pretierbarkeit stochastischer Abhangigkeiten herangezogen werden kann. 



3. Interne Validitat 

3.1 Einleitende Bemerkungen 



Der Begriff der internen Validitat wurde neben dem der externen Validitat 
(siehe Abschnitt 7) als eines von zwei Giitekriterien empirischer Untersuchun- 



7 ) Diegenannten Abhangigkeiten konntenjeweilsauch miteiner Strukturgleichung 
beschrieben werden. In den hier vorliegenden Fallen aber ware eine solche Strukturglei- 
chung mit der entsprechenden Regressionsgleichung formal equivalent. 
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gen von Donald T. Campbell (siehe z.B. Campbell, 1957 sowie Campbell & 
Stanley, 1963) eingeflihrt. Campbell und Stanley (1963, S. 175) schreiben: 
..Interne Validitat ist das grundlegende Minimum, ohne das jedes Experiment 
uninterpretierbar ist: Haben tatsachlich die experimentellen Behandlungen in 
diesem Fall einen Unterschied herbeigeflihrt?“ (Ubersetzung durch den 
Autor). 

Noch deutlicher, und in ihrer Formulierung nicht mehr nur auf experimentelle 
Untersuchungen beschrankt, formulieren Cook und Campbell (1979, S. ix) die 
Beziehung zwischen interner Validitat und kausaler Abhangigkeit, indem sie 
schreiben: ,,Als Bedrohung der internen Validitat sind Faktoren anzusehen. 
die zu ungiiltigen Schllissen darilber fiihren konnen, ob eine Beziehung zwi- 
schen manipulierten oder gemessenen Variablen einen kausalen EinfluB von 
der einen auf die andere widerspiegelt.“ (Ubersetzung durch den Autor). Of- 
fenbar verstehen Cook und Campbell unter interner Validitat eine Bedingung, 
unter der eine kausale Interpretation stochastischer Abhangigkeit moglich ist. 
Die Vorstellung, daB kausale Abhangigkeit sich nur unter bestimmten idealen 
Bedingungen auch in einer entsprechenden stochastischen Abhangigkeit au- 
Bert, ist wohl recht plausibel, denn auch deterministische physikalische Geset- 
ze gelten ja nur unter idealen Voraussetzungen, in denen storende Einfllisse 
ausgeschaltet sind. Man denke nur an das Laub, das, obwohl dem Fallgesetz 
unterworfen, nicht fallt, sondern in einem warmen Luftstrom, dem Fallgesetz 
und zugleich den Gesetzen der Aerodynamik gehorchend nach oben getragen 
wird. 

In diesem Abschnitt ist es unser Ziel, die intuitiven Vorstellungen, die dem 
Begriff der internen Validitat zugrunde liegen, an einigen Beispielen zu erlau- 
tern, auf einige Unterschiede unseres Verstandnisses zu den von anderen Au- 
toren vertretenen Versionen dieses Konzepts hinzuweisen und damit die im 
nachsten Kapitel beginnende formale Behandlung vorzubereiten. 



3.2 Grundideen 

Die Grundidee einer intern validen Abhangigkeit einer Variablen Y von einer 
zweiten Variablen X besteht im wesentlichen aus der Vorstellung, daB keine 
anderen Variablen W existieren, die den Zusammenhang zwischen X und Y 
modifizieren (vgl. Bredenkamp, 1980, S. 1). Bei dieser Formulierung wird 
nicht beriicksichtigt, ob W zwischen X und Y angeordnet ist oder nicht. 
Bedenken wir den Fall, daB eine Variable X eine zweite Variable Y nur indirekt 
tiber eine dritte Variable W beeinfluBt, so kann durchaus der Fall eintreten, 
daB bei Konstanthaltung von W der Zusammenhang zwischen X und Y ver- 
schwindet. Dies ist jedoch m.E. kein Grund die Validitat dieses Zusammen- 
hangs in Frage zu stellen, sondern lediglich seine Direktheit. Ein kausaler 
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Zusammenhang zwischen zwei Variablen X und Y ist m. E. ohne zwischen X 
und Y vermittelnde Variablen gar nicht denkbar. Als potentielle Storvariablen, 
welche die Beziehung zwischen X und Y modifizieren konnen, sollen daher im 
folgenden nicht alle Variablen betrachtet werden, sondern nur diejenigen Va- 
riablen W, die X gleich- oder vorgeordnet sind. 

I n diesem Sinn modifiziert, besagt also die hier vertretene Idee einer intern 
validen Abhangigkeit, daB bei Konstanz einer beliebigen potentiellen Storva- 
riablen W auf einem ihrer Werte w, die Abhangigkeit der Variablen Y von X 
unter dieser Konstanzbedingung dieselbe ist, wie diejenige, die man beobach- 
tet, wenn W nicht konstant ist. Von einer intern validen Abhangigkeit der 
Variablen Y von X erwarten wir also, daB sie sich mit der Auspragung einer 
dritten Variablen W nicht verandert, falls W der Variablen X gleich- oder 
vorgeordnet ist. Eine solche Veranderung war im Beispiel .Mttnzen und Elek- 
tromagnet‘ eingetreten, denn die zwischen den Munzvariablen Z x und Z u fest- 
gestellte stochastische Abhangigkeit (siehe Tabelle 2.2.3) weicht einer Unab- 
hangigkeit, wenn die Magnetvariable Z M konstant ist (siehe die Tabellen 2.2.1 
und 2.2.2). Folglich ist die Abhangigkeit der ersten Munzvariablen Z x von der 
zweiten Miinzvariabeln Z u nicht intern valide. Da wir interne Validitat, neben 
der zeitlichen Geordnetheit der Variablen, als eine notwendige Bedingung 
kausaler stochastischer Abhangigkeit ansehen, ist im Fall der Abhangigkeit der 
ersten von der zweiten Munzvariablen, die durch Gleichung 2.3.4 beschrieben 
wil'd, auch keine kausale Interpretation des Steigungskoeffizienten moglich. 

Eine ahnliche Auffassung kausaler stochastischer Abhangigkeit scheint auch 
Suppes (1970, S. 10) zu vertreten, wenn er schreibt: ,,... ein Ereignis ist die 
Ursache eines anderen, wenn auf das Erscheinen des ersten Ereignisses mit 
hoher Wahrscheinlichkeit ein zweites Ereignis folgt, und es kein drittes Ereig- 
nis gibt, welches den probabilistischen Zusammenhang zwischen dem ersten 
und dem zweiten Ereignis zum Verschwinden bringt“ (Ubersetzung durch den 
Autor). Auch bei Suppes sind wohl die beiden wesentlichen Komponenten die 
zeitliche Abfolge (,, folgt auf“) und die ideale Situation. daB es namlich kein 
drittes Ereignis gibt, welches die Beziehung zwischen den betrachteten beiden 
Ereignissen ,,zum Verschwinden bringt“. 

In der hier vertretenen Version dieser Grundidee wird diese zweite Bedingung 
in einer Hinsicht etwas gelockert, indem wir nur von den X gleich- oder 
vorgeordneten Variablen W verlangen, daB sie den Zusammenhang zwischen 
X und Y nicht modifizieren und damit verfalschen. In einer zweiten Hinsicht 
wird diese Bedingung verscharft, indem wir nicht nur keine dritten Ereignisse 
oder Variablen zulassen. die den Zusammenhang zwischen X und Y ,,zum 
Verschwinden 1 ' bringen, sondern jede Art von Modifizierung durch eine sol- 
che Variable W verbieten. Die hohe Wahrscheinlichkeit, mit der das zweite 
Ereignis auf das erste folgen soil, ist dagegen m.E. keine notwendige Bedin- 
gung fill' eine kausale stochastische Abhangigkeit, sondern nur filr deren prak- 
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tische Bedeutsamkeit. Wahrend in diesem grundlegenden Ansatz grofie Ge- 
meinsamkeit mit der Arbeit von Suppes festzustellen ist, weichen die hier 
vorgestellte Theorie und die von Suppes in der Prazisierung dieser Vorstellun- 
gen stark voneinander ab, was im einzelnen jedoch hier nicht weiter verfolgt 
werden kann. Als wichtigste Idee der in beiden Theorien vorkommenden 
idealen Situation, in der sich eine kausale Abhangigkeit entsprechend auBern 
kann, und die man als interne Validitat bezeichnen kann, bleibt jedoch festzu- 
halten, daB in einer solchen Situationsklasse die stochastische Abhangigkeit 
einer Variablen Y von X in gewisser Weise invariant bleibt, wenn eine andere, 
X gleich- oder vorgeordnete Variable W auf einem bestimmten Wert konstant 
ist. Dies ist wohl. mit Variablen anstatt mit Ereignissen ausgedriickt, eine 
ahnliche Vorstellung, wie sie Suppes im obigen Zitat auBert. 

Dabei ist allerdings zu beachten, daB wir mit dieser Invarianzbedingung je- 
weils nur stochastische Variablen auf deni gleichen Wahrscheinlichkeitsraum 
betrachten, daB wir uns also jeweils nur innerhalb einer bestimmten Untersu- 
chung, einer bestimmten Situationsklasse oder eines bestimmten Experiments 
bewegen. Selbstverstandlich wird beispielsweise die Abhangigkeit der Miinz- 
variablen Z : von der Magnetvariablen Z M eine ganz andere sein, wenn wir z.B. 
die Wurfhohe verandern, so daB die Zeit, in welcher der Elektromagnet wir- 
ken kann, verandert ist. Damit betrachten wir jedoch bereits ein anderes Expe- 
riment, namlich eines mit anderer Wurfhohe, als das in Abschnitt 2 beschrie- 
bene, was durch einen anderen Wahrscheinlichkeitsraum zu reprasentieren 
ware. Natlirlich konnen wir auch ein groBeres Experiment betrachten, in dent 
beide oder auch beliebig viele Wurfhohen vorkommen, so daB dann auch der 
EinfluB des Elektromagneten auf die Mtinzwurfergebnisse bei verschiedenen 
Wurfhohen untersucht werden konnte. Aussagen iiber die Abhangigkeit der 
Mttnz- von der Magnetvariablen in einem solchen groBeren Experiment bzw. 
groBeren Wahrscheinlichkeitsraum haben natilrlich einen groBeren Geltungs- 
bereich - eben diesen groBeren Wahrscheinlichkeitsraum - als wenn die 
Aussage nur flir eine einzige Wurfhohe gemacht wird. Die Frage der GroBe 
des Geltungsbereichs ist von der Frage der internen Validitat fur einen be- 
stimmten Geltungsbereich verschieden. Erstere hangt eng mit deni Begriff der 
.externen Validitat 1 zusammen, auf die wir im Abschnitt 7 naher eingehen. Das 
Entscheidende beim Konzept der internen Validitat ist, daB man sich jeweils 
nur auf einen bestimmten Geltungsbereich, ein einziges, aber prinzipiell wie- 
derholbares Experiment, eine einzige Situationsklasse bezieht. Diese Aussage 
behalt auch ftir solche Situationsklassen ihre Giiltigkeit, die sehr kompliziert 
sind, und in denen daher sehr viele Variablen involviert sind. 

In den nachfolgenden Abschnitten wollen wir an den aus der Pfadanalyse 
(siehe z.B. Wright 1921, 1934, 1960a,b) bekannten Pfeilschemata einige Falle 
behandeln, in denen eine dritte Variable die interne Validitat der Beziehung 
zwischen zwei Variablen verhindert, und solche, in denen dies nicht zutrifft. 
Dabei betrachten wir nur solche Falle, in denen X mit keiner anderen gleich- 
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oder vorgeordneten Variablen W in einer varianzanalytischen Interaktion 
steht. Diese besagt ja definitionsgemaB, daB der ,Effekt‘ von X auf Y nicht auf 
alien Auspragungen von W der gleiche ist. Die Variable W wiirde daher in 
einem solchen Fall den Zusammenhang zwischen X und Y modifizieren, was 
gemaB der oben erlauterten Invarianzbedingung gegen eine interne Validitat 
der Abhangigkeit der Variablen Y von X sprechen wiirde. Im folgenden wer- 
den wir uns daher mit einer anderen Art der Modifizierung einer Abhangigkeit 
zweier Variablen durch eine dritte beschaftigen. 

3.3 Falle, in denen keine interne Validitat besteht 

In den nun zu besprechenden Abbildungen nehmen wir an, daB nur die Varia- 
blen X und Y beobachtet werden, daB es aber noch eine dritte Variable W gibt, 
von deren Existenz der Beobachter aber nichts weiB, was durch die dunkel 
markierte Flache angedeutet werden soil. Die durch die Pfeile dargestellten 
kausalen Abhiingigkeiten sind nicht deterministisch, was durch die unbeschrif- 
teten kleinen Pfeile symbolisiert wird. 

Abbildung 3.3.1 zeigt eine ahnliche Situation, wie sie bereits im Beispiel 
.Mttnzen und Elektromagnet‘ beschrieben wurde, in dem namlich die zwi- 
schen den Munzvariablen auftretende stochastische Abhangigkeit durch die 
Magnetvariable zu erklaren ist. In einer solchen Situation besteht keine interne 
Validitat beziiglich der Abhangigkeit der Variablen Y von der Variablen X, da 
die zwischen X und Y zu beobachtende stochastische Abhangigkeit zumindest 
teilweise, wenn nicht sogar - wie bei der Abhangigkeit der ersten von der 
zweiten Munzvariablen - ausschlieBlich, durch die gemeinsame Abhangigkeit 
von W zustandekommt. Der Regressionskoeffizient wiirde in einer solchen 
Situation nicht das korrekte AusrnaB der einfachen kausalen reglinearen Ab- 
hangigkeit angeben. 




Abb. 3.3.1: In dieser Situation, in der Y von X sowie X und Y von einer dritten 
Variablen W direkt kausal abhangig sind, besteht bezuglich der Abhangig- 
keit der Variablen Y von X keine interne Validitat. 

Simon (1954) hat die in der Abbildung 3.3.1 skizzierte Abhangigkeit der Va- 
riablen Y von X als ,, spurious correlation" bezeichnet, was mit Scheinkorrela- 

tion ubersetzt wird (siehe z.B. Hummell & Ziegler, 1976a). Dieser Begriff, der 
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auch von anderen Autoren (siehe z.B. Namboodiri, Carter & Blalock, 1975, 
oder Suppes, 1970) verwendet wird, bezeichnet demnach den Fall, daB die 
betreffende korrelative Abhangigkeit nicht der kausalen Abhangigkeit ent- 
spricht, oder daB keine interne V aliditat gegeben ist. 

Wenn wir uns einen Vorgriff auf erst noch einzuflihrende Begriffe erlauben, so 
konnen wir den in Abbildung 3.3.1 dargestellten Fall auch wie folgt formulie- 
ren: Wir nehmen an, daB sich die kausalen reglinearen Abhangigkeiten der 
Variablen Y in der Situation der Abbildung 3.3.1 durch die Gleichung 8 ) 

(3.3.1) £(Y | X,W) = a Y0 + a YX X + a YW W 

beschreiben lassen, wobei a Y x der direkte kausale reglineare Effekt von X auf 

Y und a yw der von W auf Y ist. Dabei setzen wir voraus, daB Y den beiden 
Variablen X und W zeitlich nachgeordnet ist. und daB keine Interaktion im 
varianzanalytischen Sinn zwischen X und W besteht; andernfalls rnuBte nam- 
lich die Summe auf der rechten Seite dieser Gleichung noch um den Term 
X W, versehen mit einem entsprechenden Koeffizienten, erweitert werden 
(siehe z.B. Searle, 1971, S. 289). 

Stellen wir in dieser Situation die Frage nach der internen Validitat der Abhan- 
gigkeit der Variablen Y von X, so wollen wir wissen, ob der Steigungskoeffi- 
zient (3 Y x der Gleichung 

(3.3.2) £(Y|X) = P Y0 + P YX X 

mit dent Koeffizienten a Y x aus Gleichung 3.3.1 identisch ist, d.h. wir stellen 
uns damit die Frage, ob es in dieser Situation notig ist, die Variable W zu 
kontrollieren, sei es durch .statistische Konstanthaltung' oder durch .faktische 
Konstanthaltung 1 (siehe Abschnitt 5.3), um den kausalen Effekt a Y x von X auf 

Y feststellen zu konnen. 

Wttrden wir nun W ignorieren und die bedingte Erwartung E(Y | X) bilden, 
dann erhielten wir aus der Gleichung 3.3.1, unter Verwendung der Gleichun- 
gen A. 5. 7, A. 5. 10 und A. 5. 5 des Anhangs 

(3.3.3) £[£(Y|X,W)|X] = £(Y | X) = 

a Y0 + a YX X + a YW E( W | X). 

Diese Gleichung wiirde dann zu einem Steigungskoeffizienten flihren, der mit 
a YX identisch ist, wenn 

(3.3.4) a YW = 0, 

8 ) Man beachtedie FuBnotezur Gleichung 1.2.1. Bei Referenzen mit drei Ziffern 
weisen die ersten beiden auf den Abschnitt hin. 
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oder wenn die bedingte Erwartung 

(3.3.5) E(W | X) = E( W) 

konstant ware. Die letzte Gleichung wiirde z.B. im Fall der stochastischen 
Unabhangigkeit von X und W zutreffen, und die vorletzte, wenn der direkte 
kausale reglineare Effekt von W auf Y gleich Null ware. Diese beiden Bedin- 
gungen sind aber in dem in Abbildung 3.3.1 dargestellten Fall voraussetzungs- 
gemaB nicht erfiillt. .Interne Validitat 1 bezilglich der Abhangigkeit der Varia- 
blen Y von X soil also in dem hier behandelten Fall beinhalten, daB der Term 
a YW £(W | X) eine Konstante ist, denn nur dann erhalten wir in Gleichung 
3.3.2 einen Steigungskoeffizienten |3 Y x> der m it dem direkten kausalen regli- 
nearen Effekt ayx von X auf Y aus Gleichung 3.3.1 identisch ist, und nur dann 
wiirde W nicht den Zusammenhang zwischen X und Y modifizieren oder 
verfalschen (vgl. Bredenkamp, 1980, S. 1). 

Mit diesen Ausfuhrungen wird bereits angedattet, daK interne Validitat bezuglich der 
Abhangigkeit der Variablen Y von einer Variablen X nicht die einzige Bedingung ist, 
um einen kausalen Effekt von X auf Y feststellen zu konnen. Vielmehr kann man 
kausale Parameter auch durch .statistische Kontrolle' erhalten, namlich durch die Ein- 
beziehung einer weiteren Variablen W in das Modell (siehe Gleichung 3.3.1). Darauf 
werden wir etwas ausfuhrlicher im Abschnitt 8 eingehen. 




Abb. 3.3.2: In dieser Situation, in der Y auKer von X auch von eine dritten Variablen W 
direkt kausal abhangig ist, die ihrerseits mit X korrelieit, besteht bezuglich 
der Abhangigkeit der Variablen Y von X ebenfalls keine interne Validitat. 

Eine ganz ahnliche Situation wie die oben besprochene ist auch in Abbildung 
3.3.2 dargestellt, in der ebenfalls eine dritte Variable W Information liber Y 
enthalt, die nicht bereits in X enthalten ist. Auch ftir diese Situation nehmen 
wir an, daB sich die direkten kausalen reglinearen Abhangigkeiten der Varia- 
blen Y durch die Gleichung 3.3.1 beschreiben lassen, und entsprechend sind 
die gleichen Arguments wie oben auch hier giiltig. Im Gegensatz zur Abbil- 
dung 3.3.1 ist hier jedoch nur angenommen, daB X und W miteinander korre- 
lieren. In einem solchen Fall ist die interne Validitat aus den gleichen Grunden 
wie in der Situation der Abbildung 3.3.1 nicht gegeben, so daB man auch hier 
nicht davon ausgehen kann, daB die beobachtete reglineare Abhangigkeit der 
Variablen Y von X der kausalen entspricht. Bei Ignorierung von W ergibt sich 
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der Regressionskoeffizient (3 YX , der nicht mit dem kausalen Effekt a Y x aus 
Gleichung 3.3.1 identisch ist, da wir voraussetzen, daB weder Gleichung 3.3.4 
noch Gleichung 3.3.5 (wegen der Korrelation zwischen X und W) gilt. Dem- 
nach wird auch in diesem Fall die Beziehung zwischen X und Y durch W 
modifiziert. 



3.4 Falle, in denen moglicherweise interne Validitat besteht 

In den nun zu besprechenden Fallen spricht die Variable W nicht dagegen, daB 
die Abhangigkeit der Variablen Y von X intern valide ist, was bei entsprechen- 
der zeitlicher Geordnetheit der Variablen heiBt, daB W in dieser Situation kein 
Hindernis ist, die beobachtete reglineare Abhangigkeit der Variablen Y von X 
kausal zu interpretieren. Dabei beachte man aber, daB man ini allgemeinen 
nicht an einer einzigen potentiellen Storvariablen W entscheiden kann, ob 
tatsachlich interne Validitat vorliegt. Eine einzige Storvariable geniigt gegebe- 
nenfalls lediglich zur Entscheidung, daB interne Validitat nicht vorliegt. Eine 
positive definitive Entscheidung, daB interne Validitat vorliegt, ware nur mog- 
lich, wenn man alle potentiellen Storvariablen kennen und kontrollieren wiir- 
de. Demnach bleibt in der Regel nur der Weg der Falsifizierung im Sinne 
Poppers (Popper, 1969). 




Abb. 3.4.1: In dieser Situation, in der Y auBer von X auch von W direkt kausal 
abhangig ist, spricht W nicht gegen die interne Validitat bezuglich der 
Abhangigkeit der Variablen Y von X. Im Gegensatz zu Abbildung 3.3.2 
ist hier angenommen, daB X und W stochastisch unabhangig sind. 

In Abbildung 3.4.1 ist dargestellt, daB Y auch von einer dritten Variablen W 
kausal abhangig ist, wobei jedoch W und X stochastisch unabhangig sind, und 
auBerdem angenommen wird, daB zwischen X und W keine Interaktion im 
varianzanalytischen Sinn besteht, so daB die Abhangigkeit der Variablen Y 
von X bei verschiedenen Auspragungen von W identisch ist. Wegen der hier 
vorausgesetzten Unabhangigkeit zwischen X und W aber laBt sich die Abhan- 
gigkeit zwischen Y und X nicht durch W erkliiren, da die stochastische Unab- 
hangigkeit zwischen X und W die Gleichung 3.3.5 impliziert, so daB der Term 
O-yw £(W | X) in Gleichung 3.3.3 eine Konstante ist. Daraus folgt aber, daB die 
Koeffizienten a Y x und |3 YX aus den Gleichungen 3.3.1 bzw. 3.3.2 identisch 
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sind. In dieser Situation modifiziert also W die Beziehung zwischen X und Y 
nicht, d.h. W ist keine konfundierende Variable. 

1m Fall der Abbildung 3.4.2 ist X selbst von einer weiteren Variablen W direkt 
kausal abhangig, aber Y ist von W direkt kausal reglinear unabhangig, was 
durch den Nullpfeil von W nach Y symbolisiert ist. Auf Gleichung 3.3.1 
bezogen heiBt das, daB Otyw = 0 gilt, weswegen auch in diesem Fall der Term 
Uyw E( W [ X) in Gleichung 3.3.3 eine Konstante ist, so daB auch hier W nicht 
den Zusammenhang zwischen X und Y modifiziert. Dabei beachte man aller- 
dings, daB wir voraussetzen, daB zwischen X und W keine Interaktion im 
varianzanalytischen Sinn besteht. 




Abb. 3.4.2: In dieser Situation ist X selbst von einer dritten Variablen W direkt kausal 
abhangig, so daK auf diesem Weg Y und W zwar stochastisch voneinander 
abhangig sind, aber nicht direkt kausal. In dieser Situation spricht W nicht 
gegen die interne Validitat bezuglich der Abhangigkeit der Variablen Y von 

X. 



Im Fall der Abbildung 3.4.3 ist die kausale Abhangigkeit zwischen Y und X 
lediglich nicht mehr direkt, wenn man von der um W erweiterten Variablen- 
menge ausgeht. In diesem Punkt unterscheidet sich die hier entwickelte Auf- 
fassung interner Validitat von der von Cook und Campbell (1979, S. 50) 




Abb. 3.4.3 In dieser Situation ist sowohl Y als auch W, von der Variablen X direkt 
kausal abhangig. Daruber hinaus ist Y auch von W direkt kausal abhangig. 
Die interne Validitat der Abhangigkeit der Variablen Y von X ist durch W 
nicht gefahrdet. Die bezuglich der Variablenmenge JX,Y} direkte kausale 
Abhangigkeit der Variablen Y von X istjedoch bezogen auf dieum W 
erweiterte Menge (W,X,Y}nur noch eine totale, die sich aus direkten und 
indirekten kausalen Abhangigkeiten zusammensetzt. 
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vertretenen, da die genannten Autoren in diesem Fall, anstelle der Direktheit 
der Beziehung, deren interne Validitat in Frage stellen. In der Regel konnen 
wir jedoch nie ausschlieBen, daB es, wie in Abbildung 3.4.3 skizziert, noch 
weitere Variablen W gibt, die zwischen X und Y anzuordnen waren. Im Falle 
der zeitlichen Interpretation einer solchen Ordnung heiBt dies, daB es wohl 
immer eine zwischen der beeinflussenden und der beeinfluBten Variablen anzu- 
ordnende dritte Variable W gibt, auch wenn diese bis dahin unbekannt und 
nicht erhoben ist. Ohne die Existenz solcher zwischen Ursache und Wirkung 
vermittelnden Variablen ware ein kausaler Zusammenhang wohl auch kaurn 
denkbar. Dabei konnte sogar der Fall eintreten, daB uberhaupt keine direkte 
kausale Abhangigkeit der Variablen Y von X besteht und deren beobachtete 
stochastische Abhangigkeit allein iiber eine vermittelnde Variable W zu erkla- 
ren ist. 

Als Beispiel fur die in Abbildung 3.4.3 dargestellte Situation kann Rosenthals 
(siehe z.B. Rosenthal, 1964, 1966, Selg & Bauer, 1976, S. 59ff. oder auch 
Timaus, 1974) Versuchsleitereffekt angefiihrt werden, bei dem die oft unbe- 
riicksichtigte Variable W = ,Erwartung des Versuchsleiters 1 einen EinfluB auf 
die abhangige Variable Y hat und ihrerseits von der eigentlich unabhangigen 
Variablen X beeinfluBt wird, welche die Zugehorigkeit zu den experimentellen 
Gruppen anzeigt. 

Bei einem Versuchsleitereffekt handelt es sich also um einen Unterschied zwi- 
schen den experimentellen Gruppen, oder, was damit gleichbedeutend ist, um 
einen Zusammenhang zwischen der abhangigen Variablen und der unabhangi- 
gen Variablen, welche die Gruppenzugehorigkeit anzeigt, der nicht direkt auf 
die eigentlichen experimentellen Behandlungen zuruckzufuhren ist, sondern 
auf die vom Versuchsleiter ,ausgestrahlten' Erwartungen beziiglich des Ver- 
suchsergebnisses, welche die Versuchspersonen bewuBt oder unbewuBt zu 
erfullen bestrebt sind. Solchen Effekten ist nur durch Blind- oder Doppel- 
blindversuche vorzubeugen, bei denen auch der Versuchsleiter im unklaren 
liber den Zweck des Versuchs gelassen wird. 

Ein weiteres Beispiel fur die Situation der Abbildung 3.4.3 ist der sogenannteHaw- 
thorneeffekt, den Wilkening und Wilkening (1979, S. 1 5) wiefolgt beschreiben: „ln 
einem der Experimente sol Ite die Leistung von Arbeitern an einem besonders hell 
beleuchteten Arbeitsplatz („Experimentalgruppe") mit der Leistung von Arbeitern an 
einem normal beleuchteten Platz („Kontrollgruppe") verglichen werden. Die Experi- 
mentalgruppe zeigte hohere Leistungswerte. Aufgrund dieses Ergebnisses schloB der 
Versuchsleiter, daB zusatzliche Beleuchtung die Produktivitat erhoht. 

In einem AnschluBexperimentwurde die Beleuchtung bei der Experimentalgruppe 
wieder derjenigen der Kontrollgruppe angeglichen. Erstaunlicherweise verschlechterte 
sich hierdurch die Arbeitsleistung der Experimentalgruppe nicht." 

Diese Ergebnisse interpretieren Wilkening und Wilkening folgendermaSen: „Aufgrund 
der Versuchsbeschreibung ist anzunehmen, daB eine wesentliche Variable nicht kon- 
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stantgehalten worden ist, und zwar das Wissen der Arbeiter, Teilnehmer an einem 
Experiment zu sein. Wahrend die Mitglieder der „Kontrollgruppe" nichts von einer im 
Werk durchgefuhrten Untersuchung wuBten, fuhlten sich die Arbeiter der Experimen- 
talgruppe dadurch, daB ihr Verhalten beobachtet und registriert wurde, als „Versuchs- 
personen", die sich der Aufmerksamkeit der Geschaftsleitung bewuBt waren. Dieses 
Wissen allein genugte, um die Leistung zu verbessern. Hatte man es konstantgehalten, 
indem man die Mitglieder von Experimental- und Kontrollgruppe in gleicher Weise 
uber ihreRollealsVersuchsperson informiert hatte, waren vermutlich keineUnter- 
schiede zwischen den beiden Beleuchtungsbedingungen beobachtet worden" (1979, 
S.t7). 

Offenbar wurde bei dieser Untersuchung die Variable W = .Motivation durch Wissen/ 
Nichtwissen um Teilnahme an einer Untersuchung' von der eigentlichen unabhangigen 
Variablen X beeinfluBt, so daB diefestgestellteAbhangigkeit der Variablen Y von X 
nicht direkt auf X zuruckgefuhrt werden kann, wenn man dieses ,di rekt' auf die Varia- 
blenmenge (W,X,Y}bezieht. Bezuglich der beiden Variablen X und Y warediese 
Abhangigkeit hingegen direkt. 

Die in Abbildung 3.4.3 dargestellten kausalen Abhangigkeiten lassen sich 
durch die beiden Gleichungen 

(3.4.1) £(Y | X,W) = ctyo ctyx X + g^yw "W, mit CXyW ^ 0, 
und 

(3.4.2) £(W|X) = aw o + a^x X, mit a W x ^ 0, 

beschreiben. Wiirden wir in diesem Fall W ignorieren, so erhielten wir als 
Steigungskoeffizienten nicht ayxi der die bezuglich {W.X.Y} direkte kausale 
reglineare Abhangigkeit der Variablen Y von X angibt, sondern den totalen 
kausalen reglinearen Effekt (3yx : = a YX + ®yw ■ a wx von X auf Y, denn nach 

den Gleichungen A. 5.7, A.5.10 und A.5.5 des Anhangs gilt 

(3.4.3) £[£(Y | X,W) | X] = £(Y | X) = 

= a Y o + ctyx X + ayw £(W | X) = 

(ctyo + a YW • C<wo) + (C<YX + Ky W • Oi^x) X, 

wobei man den Ubergang von der zweiten zur dritten Formelzeile durch 

Einsetzen der Gleichung 3.4.2 erhalt. Man beachte, daB der bezuglich aller 
drei Variablen totale kausale reglineare Parameter |3yx : = Otyx + Oyw ■ a wx 
bezuglich der Variablenmenge {X,Yj direkt ist. 

In Abbildung 3.4.4 schlieBlich ist von Y noch eine weitere Variable W abhan- 
gig, was fiir die interne Validitat bezuglich der Variablen Y von X nicht von 
Bedeutung ist, denn es gibt wohl keinen Grand zu erwarten, daB bei Konstanz 
einer nachgeordneten Variablen W noch die gleiche stochastische Abhangig- 
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keit zwischen Y und X besteht. Wenn namlich Y und W stochastisch abhangig 
sind, so haben wir mit dem Wert von W auch Information iiber Y. Bei einer 
vollstandigen Abhangigkeit der Variablen W von Y lage sogar mit einem Wert 
von W auch der von Y fest, so daB dann bei gegebenem Wert von W die 
Variable Y konstant und daher unabhangig von X ware. Dies aber sollte wohl 
nicht gegen eine eventuelle interne Validitat der Abhangigkeit der Variablen Y 
von X sprechen. 




Abb. 3.4.4: In dieser Situation ist nicht nur Y von X, sondern auch die dritte Variable 
W von Y direkt kausal abhangig. Dadurch wird die interne Validitat der 
Abhangigkeit der Variablen Y von X nicht gefahrdet. 



Bei alien in dieseni Abschnitt behandelten Fallen haben wir vorausgesetzt, daB 
die Abbildungen die tatsachlichen kausalen Abhangigkeiten beschreiben, daB 
also die in diesen Pfeildiagrammen angedeuteten Fehlervariablen ,,strikt zufal- 
lig“ (vgl. Namboodiri et al., 1975, S. 446) sind. Auf diese Weise haben wir 
zwar einige Grundideen erlautern konnen, aber das eigentliche Problem der 
Definition einer , kausalen' oder , intern validen' Abhangigkeit ist darnit noch 
nicht gelost, genausowenig wie das Problem, wie man in Anwendungsfallen 
empirisch uberprufen kann, ob ein bestimmtes Pfeildiagramm und die zugeho- 
rigen Gleichungen tatsachlich die kausalen Abhangigkeiten beschreiben. Die- 
sen Aufgaben wollen wir uns in den folgenden Abschnitten zuwenden. 



3.5 Zusammenfassende Bemerkungen 



In diesem Abschnitt wurde die Grundidee internet' Validitat beziiglich der 
Abhangigkeit einer Variablen Y von einer zweiten Variablen X erlautert. Diese 
besteht darin, daB keine dritte X gleich- oder vorgeordnete Variable W exi- 
stiert, welche die Beziehung zwischen X und Y modifiziert. Gibt es eine dritte 
Variable W, die zwischen X und Y anzuordnen ist, dann kann W nicht die 
interne Validitat, sondern nur die Direktheit der Beziehung in Frage stellen. 
Hierin unterscheidet sich die hier vertretene Auffassung von der von anderen 
Autoren geauBerten (siehe z.B. Cook & Campbell, 1979, S. 50). Die oben 
genannte Grundidee wurde durch die folgende Invarianzbedingung konkreti- 
siert: Die Beziehung zwischen X und Y mulS bei Konstanz einer X gleich- oder 
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vorgeordneten Variablen W invariant bleiben, wenn interne Validitat beziig- 
lich der Abhangigkeit der Variablen Y und X bestehen soli. Anhand verschie- 
dener Pfeilschemata wurde diese Vorstellung erlautert. 



4. Einfache kausale reglineare Abhangigkeit 
4.1 Einleitende Bemerkungen 

In diesem Abschnitt ist es unser Ziel, den Begriff .einfache kausale reglineare 
Abhangigkeit 1 formal zu definieren, und damit die idealen Bedingungen anzu- 
geben, unter denen eine kausale regressiv lineare oder .reglineare 1 Abhangig- 
keit zwischen einer Variablen Y und einer Variablen X beobachtet werden 
kann, um im nachsten Abschnitt die Eigenschaften dieses Begriffs mathema- 
tisch untersuchen zu konnen. Diese sollen dann angeben, in welchen Fallen 
eine einfache kausale reglineare Abhangigkeit vorliegt, und in welchen nicht. 

Wir sprechen dabei von einfacher kausaler reglinearer Abhangigkeit, um diese 
Art der kausalen Abhangigkeit, die sich durch eine einfache Regressionsglei- 
chung mit einer unabhangigen Variablen beschreiben lafit, von der direkten 
kausalen reglinearen Abhangigkeit abzugrenzen, zu deren Beschreibung eine 
multiple Regressionsgleichung mit mehreren unabhangigen Variablen benotigt 
wird. Der Begriff der direkten kausalen reglinearen Abhangigkeit wird dann 
wichtig, wenn die Situation eine (statistische) Kontrolle anderer unabhangiger 
Variablen erfordert, die moglicherweise auch zwischen X und Y angeordnet 
sind. 

In den folgenden Abschnitten besprechen wir zunachst die Bedingungen der 
Vorgeordnetheit sowie der Invarianz getrennt, und fassen diese dann in der 
Definition einfacher kausaler reglinearer Abhangigkeit zusammen. 



4.2 Vorgeordnetheit 

Eine Formalisierung der im Abschnitt 3 beschriebenen intuitiven Vorstellun- 
gen interner Validitat ist offenbar nur moglich, wenn wir in einer gegebenen 
Situationsklasse von den Variablen X und Y entscheiden konnen, ob X der 
Variablen Y vorgeordnet ist. In Anwendungen kann man sich als dabei zu 
verwendendes Kriterium ,X ist zeitlich Y vorgeordnet 1 denken. Eine gewisse 
Geordnetheit der Variablen ist aber auch aus folgenden Griinden wichtig: 
Existiert eine weitere Variable W, die X gleich- oder vorgeordnet ist (siehe die 
Abbildungen 3.3.1 bis 3.4.2), dann ist W eine Variable, welche moglicherweise 
die interne Validitat der Abhangigkeit der Variablen Y von X gefahrden kann, 
wie z.B. in den Abbildungen 3.3.1 und 3.3.2. Ist hingegen X einer dritten 
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Variablen W vorgeordnet, wie in den Abbildungen 3.4.3 und 3.4.4, dann ist 
die interne Validitat der Abhangigkeit der Variablen Y von X durch W nicht 
gefahrdet, sondern nur deren Direktheit. 

Wir wollen nun prazisieren, was wir unter Vorgeordnetheit verstehen wollen. 
Zur Veranschaulichung der dazu benotigten Begriffe der Stochastik betrachten 
wir zunachst den Wahrscheinlichkeitsraum (Q ,*=4,P), der die bestimmte Situa- 
tionsklasse reprasentieren soli, in der die Mttnzen I und II geworfen werden. 
Dabei besteht die Menge 



(4.2.1) Q = {(a 1 ,b 1 ),(a 1 ,b 2 ),(a 2 ,b 1 ),(a 2 ,b 2 )}, 



aus den vier Elementarereignissen 



(4.2.2) 



0;>bj) 



Miinze I fallt auf die i-te Seite und 
Miinze II fallt auf die j-te Seite, 



i,j e {1,2}, 



die beim Werfen der beiden Mttnzen I und II auftreten konnen. Nun konnen 
wir die mit dent Werfen der ersten Mttnze verbundenen Ereignisse in der 
Sigmaalgebra 

(4.2.3) {{(ai.bO^aj.bz)}, {(a^bO^a,,^)}, Q, 0} 

zusammenfassen, die zugleich die von der stochastischen Variablen 

(4 2 4) 2 — J wenn die Miinze I auf die Seite 1, 

1 [0, wenn sie auf die Seite 2 fallt, 

erzeugte Sigmaalgebra ^4(Z{) ist (vgl. z.B. Bauer. 1974. S. 42). Dabei reprasen- 
tiert beispielsweise A = {(a^b^da^b,)) das Ereignis, daB die Mttnze I auf die 
Seite 1 fallt und daB Z : den Wert 1 annimmt. 



Die von einer Funktion und im besonderen von einer stochastischen Variablen 
X erzeugte Sigmaalgebra enthalt alle Ereignisse 

(4.2.5) A := {w e Q: X(tu) = x}, 

daB X einen bestimmten Wert x angenommen hat, als Elemente, aber sie 
enthalt auch alle Vereinigungsmengen solcher Ereignisse. Die von der stocha- 
stischen Variablen 

, _ ,. ^ 1, wenn die Mttnze II auf die Seite 1, 

(4.2.6) Zh = 5 

[0. wenn sie auf die Seite 2 fallt, 

erzeugte Sigmaalgebra r^4(Z[[) ist daher 

{{( a i)bi),(ai,b))}, {(a 1 ,b 2 ),(a 2 ,b 2 )}, Q, 0}. 



(4.2.7) 
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Diese Formalisierung ist jedoch fiir unsere Zwecke zu vereinfachend, da die beim 
Werfen zweier Miinzen auftretenden Ereignisse nicht nur die unter 4.2.3 und 4.2.7 
genannten sind. die ja nur die Endergebnisse des Werfens der beiden Miinzen 
reprasentieren. Auch bei einem solch einfachen Beispiel konnten wir zu jedem 
Zeitpunkt t in diesem Versuch unendlich viele Ereignisse nennen, z.B. jene, wel- 
che die raumliche Lage der Miinzen oder deren Drehgeschwindigkeit angeben. 
Eine vollstandige explizite Beschreibung dieses Versuchs miiBte alle diese Ereignis- 
se enthalten, einschlieBlich der diesen Ereignissen zugeordneten Wahrscheinlich- 
keiten. Das bedeutet jedoch nicht, daB wir alle Ereignisse explizit angeben oder 
gar, daB deren Wahrscheinlichkeiten bekannt sein oder geschatzt werden miissen. 
Allerdings muB eine formale Struktur zugrunde gelegt werden, die uns zum einen 
in die Lage versetzt, bei der formalen Abhandlung zwischen je zwei Zeitpunkten s 
und t einen weiteren Zeitpunkt anzunehmen, und zum anderen ermoglicht, gege- 
benenfalls auf alle bei diesem Versuch moglichen Ereignisse und Variablen zuriick- 
greifen zu konnen, die ja u.U. Storereignisse bzw. Storvariablen sein konnen. 









\ 



Magnet 



\ 



Miinzel 



\ 



Munze I 



t e IR 



Abb. 4.2.1: Anordnung der betrachteten Ereignisse auf der Zeitachse und schematisier- 
te Darstellung einer isotonen Familie teIR) von Sigmaalgebren. 



Eine formale Struktur, die diesen Anforderungen genugt, ist die isotone oder 
monoton wachsende Familie von Sigmaalgebren, worunter man eine Familie 
(■c^„ t 6 IR) von Sigmaalgebren versteht mit der Eigenschaft 

(4.2.8) -cT 4 S cz -c4„ falls s S t, wobei s,t e IR 

(siehe z.B. Bauer, 1974, S. 314). Demnach enthalt eine solche Sigmaalgebra 
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•<z4 t alle bis zum Punkt t moglichen Ereignisse als Elemente (siehe Abbildung 

4.2.1). 

Indem wir eine isotone Familie von Sigmaalgebren zugrunde legen, konnen 
wir ,Vorgeordnetheit‘ sowohl fiir stochastische Variablen als auch flir Sigmaal- 
gebren und Ereignisse nun wie folgt definieren: 



Definition 4.2.1. Es seien (Q ,*z4,P) ein Wahrscheinlichkeitsraum. 75 und C. 
zwei Teilsigmaalgebren von ^4, IR die Menge der reellen Zahlen versehen mit 
den iiblichen Ordnungsrelationen < sowie >, und (rz4 a t E IR) sei eine 

isotone Familie von Sigmaalgebren mit 

(4.2.9) ^(LM t ) = *4. 

te IR 

Die Sigmaalgebra 75 heiBt C (beziiglich {^4„ t £ IR)) vorgeordnet genau dann, 
wenn zwei Elemente s, t £ IR, S < t, existieren, fiir die gilt: 

(4.2.10) 75 a ^4 S , C a -^4 t und C. cf ^ 4 S . 

Die stochastische Variable X heiBt der stochastischen Variablen Y (beziiglich 
f^4„ t £ IR)) vorgeordnet genau dann, wenn die von X erzeugte Sigmaalgebra 
*&4(X.) der von Y erzeugten Sigmaalgebra *=4(Y) vorgeordnet ist. 

Das Ereignis A E ^ 4 heiBt dem Ereignis B £ -^4 (beziiglich (■^4 t , t £ IR)) 
vorgeordnet genau dann, wenn die Indikatorvariable 1 A der Indikatorvariablen 
1 B vorgeordnet ist 9 ). 



Auf unser obiges Beispiel des Werfens zweier Munzen angewandt, konnen wir also 
sagen, dalS die Variable Z M der Variablen Z, vorgeordnet ist, da die M unze 1 1 zum 
Zeitpunkt s und die Munze I zum Zeitpunkt t geworfen wird. Enthalt die Sigmaalgebra 
*J S alle bis zum Zeitpunkt s moglichen Ereignisse, so ist also *J(Z U ) Teilmenge von ^ 4 S , 
nicht jedoch *J( Z { ), da M unze I erst zum Zeitpunkt t > s geworfen wird: 

(4.2.11) *J( Z„) c ^4{Z X ) <= ^4, und ^4(Zi) 4 ^4 S 

(siehe Abbildung 4.2.1). 

Auf die entsprechende Weise ist auch die Vorgeordnetheit einer Sigmaalgebra 
gegenuber einer stochastischen Variablen oder die Vorgeordnetheit einer sto- 
chastischen Variablen gegenuber einem Ereignis und umgekehrt definiert. Eine 
stochastische Variable X z.B. soil einem Ereignis A vorgeordnet heiBen genau 



9 ) Eine stochastische Variable, die nur die Werte Null (fur A) und Eins (fur A) anneh- 
men kann, nennt man in der Wahrscheinlichkeitstheorie Indikatorvariable fur das 
Ereignis A und man benutzt normalerweise das Symbol 1*. 
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dann, wenn ^(X) der von der Indikatorvariablen 1 A erzeugten Sigmaalgebra 
^4(1 A ) = {A,A,Q,0} vorgeordnet ist. 

Der Begriff der Vorgeordnetheit bezieht sich also immer auf eine bestimmte 
isotone Familie (*A X , t £ IR) von Sigmaalgebren. In Anwendungen 1 " kann eine 
solche Sigmalalgebra -*A X als die Menge der bis einschlieBlich zum Zeitpunkt t 
moglichen Ereignisse interpretiert werden. Dabei sind nicht etwa MeBzeit- 
punkte entscheidend, sondern vielmehr die ,Wirkzeitpunkte‘. Wann Variablen 
tatsachlich erhoben werden, ist eher eine technische Frage und hat mit der 
eigentlich inhaltlichen Theorie nur bedingt zu tun. 

Auch der Begriff ,Gleichgeordnetheit‘ laBt sich nun exakt wie folgt be- 
stimmen : 



Definition 4.2.2. Es mbgen wieder die Voraussetzungen und Schreibweisen 
gelten, die in der Definition 4.2.1 aufgefuhrt sind. 

Die Sigmaalgebra 75 heiBt C. (beziiglich (•c 4„ t E IR)) gleichgeordnet genau 
dann, wenn C nicht 75 und 75 nicht (2 vorgeordnet ist, und ein t £ IR existiert 
mit 

(4.2.12) 75 cz ^A x und C c vA x . 

Die stochastische Variable X heiBt der stochastischen Variablen Y (beziiglich 
(■^ 4 X , t e IR)) gleichgeordnet genau dann, wenn und *z4( Y) gleich geord- 

net sind. 

Das Ereignis A 6 r=A heiBt dent Ereignis B 6 (beziiglich (■<= 4 X , t £ IR)) 
gleichgeordnet genau dann, wenn »=4(1 a) und 1 B ) gleichgeordnet sind. 



Gleichgeordnetheit kann in Anwendungsfallen als zeitliche Gleichgeordnet- 
heit interpretiert werden, aber andere Interpretationen sind ebensogut denk- 
bar. Als Beispiel zweier gleichgeordneter Variablen kann man sich zwei gleich- 
zeitig experimentell manipulierte unabhangige Variablen X! und X 2 vorstellen. 



4.3 Invarianz 



Die Bedingung, daB X der Variablen Y vorgeordnet ist, ist eine notwendige, 
aber keineswegs hinreichende Bedingung einer einfachen kausalen reglinearen 



10 ) Wie bei jedem formalen Begriff sind auch bei dem der Vorgeordnetheit prinzipiell 
andere Anwendungen und , .Interpretationen" erlaubt, insbesondere auch solche, in 
denen IR nicht als Zeitmenge interpretiert wird. Ob solche alternativen Interpretatio- 
nen ebenfalls zu etwas Sinnvollem fuhren, vermag ich zur Zeit nicht zu beurteilen. 
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Abhangigkeit der Variablen Y von X, wie wir bereits im Abschnitt 2.3 festge- 
stellt haben, in dem die Abhangigkeit der ersten von der zweiten Munzvaria- 
blen fiir das Beispiel ,Miinzen und Elektromagnet' behandelt wurde. Unser 
Ziel ist nun, formale Eigenschaften zu finden, welche die Falle der Abbildun- 
gen 3.3.1 und 3.3.2, in denen keine interne Validitat besteht, von denjenigen 
der Abbildungen 3.4.1 und 3.4.2 unterscheiden, in denen durch die dritte 
Variable W die Validitat nicht in Frage gestellt wird. Fur die anderen beiden 
Falle der Abbildungen 3.4.3 und 3.4.4 haben wir ja bereits festgestellt, daB 
dort X der Variablen W vorgeordnet ist, womit W die Validitat der Abhangig- 
keit der Variablen Y von X nicht gefahrden kann. In diesen Fallen ist W also 
keine potentielle Storvariable, da sie hochstens, wie im Fall der Abbildung 
3.4.3, dazu fiihrt, daB eine beziiglich {X,Y} direkte kausale reglineare Abhan- 
gigkeit, bezogen auf die um W erweiterte Variablenmenge jW,X,Y} nicht 
mehr direkt ist (vgl. hierzu auch Flummell & Ziegler, 1976b, S. E 57). Zur 
Unterscheidung der Falle der Abbildungen 3.3.1 und 3.3.2 von denen der 
Abbildungen 3.4.1 und 3.4.2 ist offenbar die Forderung, daB X der Variablen 
Y vorgeordnet ist, nicht hinreichend, da dies fiir jeden der genannten vier Falle 
zutrifft, wenn auch diese Vorgeordnetheit zweifellos eine notwendige Bedin- 
gung fur eine einfache kausale reglineare Abhangigkeit ist. 

Notwendig, aber ebenfalls nicht hinreichend ist die Gultigkeit einer Gleichung vom 
Typ 

(4.3.1) £(Y | X) = a Y0 + a YX X, 

durch die eine reglineare Abhangigkeit definiert ist. Die in dieser Gleichung vorkom- 
mende reelle Zahl bezeichnen wir als Steigungskoeffizient der Regression von Y 
unter X. In Abschnitt 2 haben wir gesehen, daR mit einer solchen Gleichung sowohl die 
intuitiv kausale reglineare Abhangigkeit der Munz- von der Magnetvariablen, als auch 
die nichtkausale reglineare Abhangigkeit der ersten von der zweiten Munzvariablen 
beschrieben werden konnen (siehe die Gleichungen 2.3.4, 2.4.2 und 2.4.3). 

Diese gesuchte Eigenschaft 11 ), die neben der Vorgeordnetheit eine einfache 
kausale reglineare Abhangigkeit der Variablen Y von X definieren soil, ist die 
Formalisierung der Vorstellung, daB eine solche Abhangigkeit nicht von der 
Auspragung w einer potentiellen Storvariablen W abhangen darf. Damit prazi- 
sieren wir die Idee, daB eine potentielle Storvariable W nicht den Zusammen- 
hang zwischen X und Y ,,modifizieren“ (Bredenkamp, 1980, S. 1) darf, oder 



u ) Diese Eigenschaft wurdeahnlich auch schon von Lazarsfeld (1955, S. 125) verbal 
formuliert. Flummell und Ziegler (1976b, S. E 32) haben nicht akzeptiert, daR dabei 
tatsachlich alle potentiellen Storvariablen auf dem zugrunde gelegten Wahrscheinlich- 
keitsraum wichtig sind, und eben nicht nur die in der Theorie spezifizierten, die also in 
der Model I gleichung vorkommen. Das Argument, daR solche Kausalaussagen nicht im 
Sinne einer Verifikation uberpruft werden konnen, spricht nicht gegen ein solches 
Konzept, da ja die Uberprufung nach dem Falsifikationsverfahren moglich ist. 
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anders formuliert, daB keine ,,konfundierenden Faktoren" existieren dtirfen 
(vgl. z.B. Sarris, 1968, S. 183). 

Dabei ist es unerheblich, ob eine solche Variable W erhoben wurde Oder nicht. Wesent- 
lich ist nur, daB W eine stochastische Variable auf dem gleichen Wahrscheinlichkeits- 
raum (Q ,^4,P) ist, der die betreffende Situationsklasse reprasentiert, so daB W prinzipiell 
erhoben werden konnte. Beim Beispiel .Munzen und Elektromagnet' beispielsweise ist die 
Magnetvariable Z M auch dann vorhanden und hat eine Wirkung auf die Munzwurfergebnis- 
se, wenn sie nicht erhoben wird. Dagegen ware eine Variable, die den Zustand eines zweiten 
Elektromagneten anzeigen wurde und eine Varianz groBer Null hatte, keine stochastische 
Variable auf dem gleichen Wahrscheinlichkeitsraum, da aus der Beschreibung des Beispiels 
zumindest implizit hervorgeht, daB dort nur ein einziger Elektromagnet installiert ist. Ein 
Experiment, in dem zwei Elektromagneten vorkommen, wurde durch einen anderen Wahr- 
scheinlichkeitsraum reprasentiert, als das beschriebene Experiment, in dem es nur einen 
einzigen Elektromagneten gibt. 

Wir wollen nun zunachst prazisieren, was wir unter potentiellen Storvariablen 
W verstehen wollen. Die Bedingung, daB W der Variablen X gleich- oder 
vorgeordnet ist, reicht nicht aus, da dann auch Wj = X Z, W 2 = X + Z u.a. 
potentielle Storvariablen waren, falls Z der Variablen X gleich- oder vorgeord- 
net ist, was aus Definition 4.2.2 folgt. Als potentielle Storvariablen sollen aber 
nur solche Variablen gelten, die unabhangig von X definiert sind. Die folgende 
Definition stellt dies sicher. 



Definition 4.3.1. Es mogen wieder die Voraussetzungen und Schreibweisen 
gelten, die in der Definition 4.2.1 aufgefuhrt sind. AuBerdem seien X und W 
stochastische Variablen und Z: Q — > IR n , n E { 1 , 2 ,. . .}, ein stochastischer 
Vektor auf (Q,^,P). 

W heiBt potentielle Storvariable bezliglich X [und 4 X , t £ IR)] genau dann, 
wenn gilt: a) W ist X gleich- oder vorgeordnet, b) Wenn W = f(X,Z), wobei Z 
der Variablen X gleich- oder vorgeordnet ist und f: X(Q) X Z(Q) — > IR, so 
existiert eine Funktion g: Z(Q) — > IR mit f(X,Z) = g(Z). [X(Q) ist dabei das 
Bild von Q unter X.] 



Variablen wie = X . Z oder W 2 = X + Z sind demnach keine potentiellen 
Storvariablen bezliglich X, da sie nicht nur von Z, sondern auch von X abhan- 
gen (siehe Punkt b der obigen Definition). 

Am folgenden Fall soil nun die Invarianzbedingung weiter erliiutert werden: 
Angenommen, die Variable Y ware sowohl von X, als auch von W kausal 
abhangig. und diese kausale Abhangigkeit lieBe sich durch 

(4.3.2) E(Y | X,W) f |3 yo + (3yx X + (3 YW W 

beschreiben, wobei X und W stochastisch unabhangig seien, so daB auch £(W|X) 
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= E(W) gilt. Dann galte nach den Gleichungen A. 5. 7, A. 5. 5 und A. 5. 10 die 
Gleichung 4.3.1 mit = |3yo + Pw E(W) und = P YX , d.h. der Effekt 
von W auf Y ware additiv zu dem von X. Fur die bedingte Erwartung von Y 
unter X gegeben das Ereignis A, daB W den Wert w angenommen hat, gilt 
dann auch 

(4.3.3) E a (Y | X) p = s (Pyo + Pw w ) + Pyx X = a Y0 + a Y x X, 

wobei = Pyo + Pyw w und a YX = Pyx- Das bedeutet, daB der Steigungs- 
koeffizient a Y x aus Gleichung 4.3.1 invariant bleibt, wenn die potentielle Stor- 
variable W konstant gehalten wird. d.h. W ist keine tatsachliche Storvariable. 

Die Invarianz von a Y x ist nicht selbstverstandlich. Gilt z.B. weder P YW = 0, 
noch £(W | X) ~ £(W), so folgt aus Gleichung 4.3.2 und den oben angegebe- 
nen Gleichungen des Anhangs, daB a ^ P Y x- Folglich gilt dann bei Kon- 
stanz von W nicht mehr der Steigungskoeffizient Ot Y x. W ist dann tatsachlich 
eine Storvariable, die den Zusammenhang zwischen X und Y modifiziert. Die 
Invarianzbedingung postuliert aber genau diese Invarianz des Steigungskoeffi- 
zienten bei Konstanz aller potentiellen Storvariablen. 



4.4 Definition 

Nach diesen Uberlegungen soil eine stochastische Variable Y von einer zwei- 
ten stochastischen Variablen X genau dann einfach kausal reglinear abhangig 
heiBen, wenn erstens X der Variablen Y vorgeordnet ist und zweitens die 
Invarianzbedingung gilt. Dies soil praziser in der folgenden Definition festge- 
halten werden: 



Definition 4.4.1. Es seien X und Y stochastische Variablen auf dem Wahr- 
scheinlichkeitsraum ( Q.,tzA,P ) mit den Erwartungswerten E(X) bzw. E(Y). 

4 t , teIR) sei eine isotone Familie von Sigmaalgebren mit & (U *=4 Z ) = ^ 4 . 

teIR 

AuBerdem sei Y von X reglinear abhangig, d.h. 

(4.4.1) £(Y | X) = a Y0 + a Y x X. 

Die Variable Y heiBt von X (beziiglich t 6 IR)) einfach kausal reglinear 

abhangig und die reelle Zahl a Y x heiBt einfacher kausaler reglinearer Effekt 
von X auf Y genau dann, wenn die folgenden Bedingungen erfiillt sind: 

Vorgeordnetheit: X ist Y vorgeordnet 1 ^). 



12 ) 



Man beachtedie Definitional 4.2.1und 4.2.2. 
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Invarianz: Fur jede potentielle Storvariable W gilt 
(4.4.2) E(Y | X,W) = p YX X + f(W) 

mit a YX = Pyx und f(W) = a Y0 + £(F | W), wobei F := Y-£(Y | X). 



Man beachte, daB f(W) eine Funktion ist, die ausschlieBlich von W abhangt. 
Insbesondere wird dadurch eine Interaktion oder Modifizierung der Abhan- 
gigkeit der Variablen Y von X durch W ausgeschlossen. 



In dieser Definition werden keinerlei formal undefinierte Begriffe verwendet. 
Es handelt sich also urn eine rein mathematische Definition, mit dem damit 
verbundenen Vorteil, daB eine rein mathematische Untersuchung der daraus 
ableitbaren Folgerungen moglich ist. Indem man in einem Anwendungsfall 
festlegt, daB der zugrundegelegte Wahrscheinlichkeitsraum (Q,-^4,P) eine ganz 
bestimmte Situationsklasse oder ein ganz bestimmtes Experiment reprasen- 
tiert, daB jede Sigmaalgebra & die bis zum Zeitpunkt t moglichen Ereignisse 
als Elemente enthalt, und daB die Variablen X und Y fiir ganz bestimmte 
Variablen stehen, wird eine Interpretation oder Anwendung des formalen Be- 
griffs der einfachen kausalen reglinearen Abhangigkeit vorgenommen. 

Ebenso wie beim formalen Begriff der Wahrscheinlichkeit, sind auch hier verschiedene 
Anwendungen oder Interpretationen denkbar. Zum einen kann man versuchen, mit 
diesem Begriff objektive kausale reglineare Abhangigkeiten zu beschreiben, zum ande- 
ren aber auch subjektive Sachverhalte, womit man sich in die psychologische For- 
schung der Kausalattribuierung begabe (vgl. z.B. Heider, 1958, Herkner, 1980, Jones, 
Kanouse, Kelley, Nisbett, Valins & Weiner, 1971, 1972, und Weiner, 1972, 1974). 
Sowohl fur die erstgenannten methodologischen, als auch fur die letztgenannten psy- 
chologischen Anwendungen sind die aus der Definition ableitbaren formalen Eigen- 
schaften dieses Begriffs von groKer Bedeutung, da sie oft leichter als die in der Defi- 
nition genannten Eigenschaften empirisch uberprufbar sind. Diesen formalen Eigen- 
schaften und den darauf basierenden empirischen Forschungsstrategien im methodolo- 
gischen Bereich wenden wir uns im Abschnitt 5 zu. 

Zur Erlauterung der Definition 4.4.1 betrachten wir die folgende Situation: Y sei von X 
einfach kausal reglinear abhangig. Gilt dann beispielsweise auKer 

(4.4.3) £(Y | X) = u Y0 + « YX X 

auch, daK die Residualvariable F von einer potentiellen Storvariablen W reglinear ab- 
hangig ist, 

(4.4.4) £(F | W) = a F0 + a FW W, 



dann muG auch 
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(4.4.5) £(Y|X,W) = (a Y0 + a F0 ) + Ctyx X + OCpW W + Cty x x W X'W, 

mit a Y,X x* = 0 

gelten. Zum einen heiBt dies, daB der Koeffizient a YX bei einer Erweiterung des Modells 
um eine solche Variable W invariant bleiben muB, und zum anderen, daB keine Inter- 
aktion im varianzanalytischen Sinn zwischen X und W bestehen darf. Um diese Aussa- 
gezu verifizieren, braucht man lediglich die Gleichungen 4.4.4 in Gleichung 4.4.2 
einzusetzen: 

(4.4.6) E{ Y | X,W) = a Y0 + a YX X + a F0 + a PW W. 

1st in einem Anwendungsfall diese Eigenschaft nicht erfullt, so konnen wir schlieBen, 
daB Y von X nicht einfach kausal regl inear abhangig ist. 

Die Definition 4.4.1 hat sowohl fur experimentelle, als auch filr nichtexperi- 
mentelle Forschungssituationen praktische Konsequenzen, da sie fur beide 
Falle Moglichkeiten aufzeigt, wie man eine Behauptung, daB eine reglineare 
Abhangigkeit einfach kausal ist, falsifizieren kann. Sowohl das in der Inva- 
rianzbedingung enthaltene Interaktionsverbot der Variablen X mit einer po- 
tentiellen Storvariablen W laBt sich in experimentellen und in nichtexperimen- 
tellen Forschungssituationen uberprlifen, als auch die darin enthaltene Aussa- 
ge, daB der Koeffizient a Y x b 6 ' der Erweiterung von E(Y | X) nach E(Y | X,W) 
invariant bleibt, d.h. in Gleichung 4.4.1 und in der Gleichung 4.4.2 derselbe 
ist. Beide Aspekte der Additivitatsbedingung sollen an je einem Beispiel erlau- 
tert werden. 



4.5 Beispiel: Miinzen und Elektromagnet (1. Fortsetzung) 

Aus Abschnitt 2.3 liegt bereits die Gleichung 

(4.51) E(Z 1 |z„) = p,o + (3,2 z„ = 0.5666 + 0.1905-Z„ 

vor. und wir haben nach Theorem 5.4.1 zu prttfen, ob |3,2 = 0.1905 mit deni 
Koeffizienten a ,2 aus der Gleichung 

(4.5.2) E(Zi | Z n ,Z M ) = P(B | Z n ,Z M ) = 

= a, 0 + a 12 Z n + a, 3 Z M + ctu Zn-Zjy, 

identisch ist, und ob a, 4 = 0 gilt, wobei 

(4.5.3) B := {at e Q: Z^w) = 1} 



wieder das Ereignis ist, daB Miinze I auf die Metallseite fallt. 
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Die zunachst unbekannten Parameter konnen wir aus den vier Gleichungen 

(4.5.4) P(B | Z n = 0,Z M = 0) = Oio = 0.5 

(4.5.5) P(B | Z II =0,Z M =1) f a 10 + a 13 = 0.9 

(4.5.6) P(B | Z n =l,Z M =0) = a 10 + a ]2 = 0.5 

(4.5.7) P(B | Z n =l,Z M =l) = a 10 + a 12 + a 13 + a 14 = 0.9 

bestimmen, wobei wir die numerischen Werte fur die bedingten Wahrschein- 
lichkeiten aus den Daten der Tabellen 2.2.1 und 2.2.2 erhalten. Aus obigem 
Gleichungssystem folgen dann die in der Gleichung 

(4.5.8) P(B|Z„,Z m )= 0.5 + 0-Z„ + 0.4-Zm + 0-Z„-Z M 

angegebenen Koeffizienten. Zwar ist das Interaktionsverbot erfiillt, da a J4 = 
0. aber es gilt cti 2 = 0 A |3 ]2 = 0.1905. woraus wir nach Definition 4.4.1 
schlieBen konnen, daB Z : nicht von Z n einfach kausal reglinear abhangig ist. 

Darnit haben wir ein Beispiel ftir den ersten in der Invarianzbedingung enthal- 
tenen Aspekt behandelt, der die Gleichheit der Koeffizienten a 42 und |3 12 aus 
den Gleichungen 4.5.1 und 4.5.2 betrifft. Den zweiten Aspekt, namlich das 
Interaktionsverbot erlautern wir im folgenden Abschnitt. 



4.6 Beispiel: Drogen und Aktivierung 

In der Tabelle 4.6.1 sind die bedingten Erwartungswerte der abhangigen Va- 
riablen 

(4.6.1) Z A := ,,psychophysiologische Aktivierung" 

angegeben, die aus einem fiktiven Experiment stammen rnogen, in dem die 
Wirkung der unabhangigen Variablen 

^ 2 ) 2 _ I 1, wenn die Versuchsperson das Verurn, 

[-1, wenn sie das Placebo einnimmt, 

untersucht werden soil. Dabei nehmen wir an, daB alle einschlagigen Kontrolltech- 
niken, wie z.B. Randomisierung, Doppelblindversuch u.a. durchgeflihrt wurden. 
AuBerdem sei von den Versuchspersonen bekannt, ob sie intro- oder aber extra- 
vertiert 13 ) sind, was durch die Personlichkeitsvariable 



13 ) Die hier vorgenommene Reduzierung der vielstufigen quantitativen Personlich- 
keitsvariablen Intro/ Extraversion auf zwei Auspragungen wird ausschlieGlich aus Grun- 
den der einfacheren Darstellbarkeit des Interaktionsverbots vorgenommen. 
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(4.6.3) 



j 1, wenn die Versuchsperson introvertiert. 
[ - 1 . wenn sie extravertiert ist. 



angezeigt wird. 

In diesem Beispiel konnen wir eine eindajtige zeitliche Ordnung zwischen den Varia- 
blen vornehmen, denn die Intro/ Extraversionsvariable Z P ist als Personlichkeitsvariable 
zeitlich vor der experi mentel I manipulierten Drogenvariablen Z D anzuordnen, und 
letztere zeitlich vor der Aktivierungsvariablen Z A , die einen psychophysiol ogischen 
Zustand der Versuchspersonen nach der Einnahme der Droge bzw. des Placebos an- 
gibt. Falls in diesem Beispiel die Invarianzbedingung erf u 1 1 1 ware, konntediezwi- 
schen Z A und Z D bestehende reglineare Abhangigkeit also kausal interpretiert werden. 
Ob man in diesem Beispiel diese Voraussetzung machen kann, soil nun uberpruft 
werden. 



Tabelle 4.6.1: Bedingte Erwartungswerte der abhangigen Variablen ,Aktivie- 
rung‘ in einem 2x2-kreuzfaktoriellen Design. 





Introvertierte 


Extravertierte 




Droge 


30 


20 


25 


Placebo 


25 


5 


15 




27.5 


12.5 


20 



Aus den in der Tabelle 4.6.1 angegebenen Zahlen konnen wir ersehen, dab eine 
Interaktion im varianzanalytischen Sinn besteht, denn 30 - 25 20 - 5, d.h. 

die Differenz der bedingten Erwartungswerte zwischen denjenigen, welche die 
Droge und denjenigen, die das Placebo einnehmen, ist bei Introvertierten 
geringer als bei Extravertierten. 

Fur die bedingte Erwartung E(Z A | Z D ,Z P ) gilt 

(4.6.4) £(Z a | Z D ,Zp) = a 0 + a D Z D + a P Z P + a DxP Z D -Z P = 

= 20 + 5.0-Z d + 7.5-Z P + (— 2.5)-Z d -Z p , 



wobei wir die numerischen Werte aus den vier Gleichungen 

(4.6.5) £(Z a | Z D =1,Z P =1) = a 0 + a D + a P 4- a DxP = 30, 

(4.6.6) £(Z a | Z D =1,Z P = — 1) = a 0 + a D - a P - a DxP = 20,, 

(4.6.7) £(Z A I Z D =-1,Zp=1) = « 0 - a D 4- a P - a DxP = 25, und 
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(4.63) E{ Z A |Z D = — 1,Z P = — 1) = a 0 - a D - a P + a DxP = 5 

berechnen konnen, die nach den Gleichungen A. 5. 2, und A. 4. 6 aus der ersten 
Formelzeile von 4.6.4 folgen. 

Aus Gleichung 4.6.4 konnen wir ersehen, daB die reglineare Abhangigkeit der 
Variablen Z A von Z D nicht einfach kausal ist, denn andernfalls miiBte gemafi 
Definition 4.4.1 der letzte Summand in Gleichung 4.6.4 wegfallen, d.h. Ctoxp 
diirfte nicht -2.5, sondern miiBte gleich Null sein, was dann der Fall ware, 
wenn keine Interaktion zwischen der Drogenvariable Z D und der Intro/Extra- 
versionsvariablen Z P bestande 14 ). 

Dieses Beispiel verdeutlicht, daB die Invarianzbedingung einer einfachen kau- 
salen reglinearen Abhangigkeit einer Variablen Y von X inimer dann nicht 
gegeben ist, wenn eine Interaktion von X mit einer potentiellen Storvariablen 
W, im Beispiel, der Intro/Extraversionsvariablen, besteht. Ein moglicher Weg 
ware nun, die Aussage, daB die Aktivierungsvariable Z A einfach kausal regline- 
ar von der Drogenvariablen Z D abhangig ist, auf jeweils eine der beiden Grup- 
pen der Intro- bzw. Extravertierten zu beschranken, so daB fur jede dieser 
beiden Gruppen ein unterschiedlicher einfacher kausaler reglinearer Effekt der 
Drogenvariablen angenommen wird. Die Bedingung der Invarianz konnte 
dann jeweils innerhalb dieser beiden Gruppen uberpriift werden, indem man 
nach anderen potentiellen Storvariablen sucht, und priift, ob fur diese die in 
Definition 4.4.1 formulierte Invarianzbedingung erfiillt ist. 

Das Interaktionsverbot, das die hier vorgeschlagene Definition einfacher kausaler regli- 
nearer Abhangigkeit beinhaltet, ist zweifellos sehr restriktiv, und es stellt sich die 
Frage, ob ein derart strenger Begriff einer kausalen reglinearen Abhangigkeit in Wissen- 
schaften wie der Psychologie uberhaupt angewandt werden kann. Eine pauschale Ant- 
wort auf diese Frage ware wohl nicht angebracht. Vielleicht mussen wir uns in vielen 
Bereichen der Psychologie tatsachlich damit zufriedengeben, nur durchschnittliche 
kausale stochastische Effekte feststellen zu konnen, im obigen Beispiel moglicherweise 
also den durchschnittlichen einfachen kausalen reglinearen Effekt der Drogenvariablen 
Z D auf die Aktivierungsvariable Z A , als Mittei der Effekte in den beiden Gruppen der 
Intro- bzw. Extravertierten. Was aber ware, wenn der durchschnittliche Effekt N ull 
ware, wohingegen bei den Extravertierten ein starker positiver, bei den Introvertierten 
dagegen ein ebenso starker negativer Effekt vorlage?Zumindest in Fallen mit einer 
solchen disordinalen Interaktion (vgl. z.B. Bredenkamp, 1980, S. 24ff. Oder Flenning 
& Muthig, 1979, S. 204ff.) kann ein Verzicht, die kausalen reglinearen Abhangigkeiten 
zu suchen, fatale Konsequenzen haben. 



I4 j In realen Forschungssituationen mussen naturlich zur Entscheidung, ob eine Inter- 
aktion besteht oder nicht, statistische Verfahren zur Flypothesenbewertung durchge- 
fuhrt werden, ebenso wie bei der Uberprufung, ob der Koeffizient a Y x (siehe Glei- 
chung 4.4.1) bei der Erweiterung des Modells urn W invariant bleibt (si#ie Gleichung 
4.4.2). Solche Stichprobenprobleme sind jedoch nicht Gegenstand dieses Beitrags. 
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4.7 Zusammenfassende Bemerkungen 

In diesem Abschnitt wurden die im Abschnitt 3 erlauterten intuitiven Vorstel- 
lungen interner Validitat zum Begriff einfacher kausaler reglinearer Abhangig- 
keit prazisiert, auf dem die gesamte weitere Theorie aufgebaut ist. Eine solche 
Abhangigkeit gibt eine reine, unkonfundierte Beziehung an, die durch eine 
einfache lineare Regressionsgleichung beschrieben werden kann. Es wurden 
zwei Bedingungen angegeben und erlautert, welche eine einfache kausale re- 
gressiv lineare Abhangigkeit einer stochastischen Variablen Y von einer zwei- 
ten stochastischen Variablen X definieren: Die Bedingung der Vorgeordnet- 
heit, die in Anwendungsfallen als zeitliche Vorgeordnetheit interpretiert wer- 
den kann und die Bedingung der Invarianz, mit der die Existenz von Storva- 
riablen ausgeschlossen wird, die den Zusammenhang zwischen X und Y modi- 
fizieren oder verfalschen. Dadurch, daB stochastischen Variablen die Eigen- 
schaft der einfachen kausalen reglinearen Abhangigkeit zugeschrieben wurde, 
bezieht sich eine solche Aussage immer auf einen ganz bestimmten Wahr- 
scheinlichkeitsraum, der in Anwendungen ein ganz bestimmtes Experiment 
oder eine ganz bestimmte Untersuchungssituationsklasse reprasentiert. Der 
Wahrscheinlichkeitsraum ist gewissermaBen der Geltungsbereich einer Aussa- 
ge liber eine einfache kausale reglineare Abhangigkeit, worauf wir ausfiihrli- 
cher im Abschnitt 7 eingehen. Genauso bezieht sich die Vorgeordnetheit auf 
eine ganz bestimmte isotone Familie t e IR) von Sigmaalgebren, beispiels- 

weise auf die in einem ganz bestimmten Experiment gegebene Familie von 
Sigmaalgebren welche die bis zum Zeitpunkt t moglichen Ereignisse ent- 

halten. 



5. Eigenschaften einfacher kausaler reglinearer Abhangigkeit 
5.1 Einleitende Bemerkungen 

In diesem Abschnitt untersuchen wir die formalen Eigenschaften des im letz- 
ten Abschnitt definierten Begriffs der einfachen kausalen reglinearen Abhan- 
gigkeit und behandeln die sich daraus ergebenden Konsequenzen fur die Stra- 
tegien empirischer Untersuchungen. Dabei sind zwei Fragen von wesentlicher 
Bedeutung: Wie uberpruft und falsifiziert man in einer vorliegenden empiri- 
schen Untersuchung die Aussage, daB eine einfache kausale reglineare Abhan- 
gigkeit besteht, und zweitens, wie kann man eine noch durchzuftihrende Un- 
tersuchung so planen und anlegen, daB die Annahme, daB eine einfache kausale 
reglineare Abhangigkeit vorliegt, moglichst alien Falsifizierungsversuchen 
standhalt. 

Im Abschnitt ,Unkonfundiertheit‘ zeigen wir zunachst, daB der einfache kau- 
sale reglineare Effekt Clyx von X auf Y auch bei Konstanz potentieller Storva- 
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riablen gilt, falls Y von X einfach kausal reglinear abhangig ist. Am Beispiel 
.Mttnzen und Elektromagnet’ demonstrieren wir dann, wie diese Eigenschaft 
benutzt werden kann, um die Aussage, daB eine einfache kausale reglineare 
Abhangigkeit der ersten von der zweiten Miinzvariablen besteht, zu falsifi- 
zieren. 

Im Abschnitt .vollstandige Abhangigkeit" zeigen wir, welcher Art der determi- 
nistische Kausalitatsbegriff ist, der in der hier vorgestellten Theorie als Spezial- 
fall enthalten ist. Im Abschnitt .faktische Konstanthaltung’ behandeln wir 
dann eine erste MaBnahme zur Planung von Untersuchungen, mit deni Ziel, 
die Validitat einer reglinearen Abhangigkeit herzustellen. SchlieBlich formulie- 
ren wir im Abschnitt .Unabhangigkeit’ eine notwendige Bedingung einfacher 
kausaler reglinearer Abhangigkeit und zeigen, wie die experimentellen Kon- 
trolltechniken der Randomisierung und der Parallelisierung auf die hier vorge- 
stellte Theorie basiert werden konnen. 



5.2 Unkonfundiertheit 

Wir zeigen als erstes, daB otyx auch der Steigungskoeffizient der einfachen 
linearen Regression der Variablen Y unter X bei Konstanz einer potentiellen 
Storvariablen ist. wenn wir voraussetzen konnen, daB Y von X einfach kausal 
reglinear abhangig ist. Daraus ergibt sich eine Moglichkeit zur Falsifizierung 
einer Aussage, daB Y von X einfach kausal reglinear abhangig ist, da sich leicht 
uberprufen laBt, ob die genannten Steigungskoeffizienten tatsachlich identisch 
sind oder nicht. 



Theorem 5.2.1. Es mdgen wieder die Voraussetzungen und Schreibweisen gel- 
ten, die in der Definition der einfachen kausalen reglinearen Abhangigkeit 
aufgeflihrt sind. 

Wenn Y von X einfach kausal reglinear abhangig ist, mit dem einfachen kausa- 
len reglinearen Effekt a YX von X auf Y, dann gilt auBer 

(5.2.1) E(Y | X) = a Y o + a Yx X, 
auch fur jedes Ereignis 

(5.2.2) A := {co e £2: W(to) = w}, mit P(A) > 0, 

daB eine potentielle Storvariable W einen bestimmten Wert w annimmt 

(5.2.3) £ a ( Y | X) p = s a Y0 + £(F | A) + a YX X, 



wobei 
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(5.2.4) F := Y — £(Y | X) 

und £(F | A) der bedingte Erwartungswert von F gegeben das Ereignis A ist. 



Beweis. Nach den Definitionen 4.4.1 und A .5.1 gilt 

(5.2.5) £( 1 D Y) = E[ 1 d [a Y0 + a YX X + £(F | W)]], 
fur alle D s «#(X, W). 

Also gilt auch fur alle A mit P(A) >0, die durch 5.2.2 definiert sind, und alle C e <=^(X) 

(5.2.6) p^y£(l A lc Y) =p^£[l A l c [a Y0 + a YX X + £(F|W)]]. 

Daraus folgt nach Gleichung A. 4.1 

(5.2.7) £ A (1 C Y) = £ a [i c [«yo + £(F | W) + a YX X]] = 

= £A[lc[avo + £(F I A) + a YX X]], 

denn £ A [1 C E(F | W)] =£ A [1 C E(F | A)], da E(F | W) bezuglich des MaBes P A eine 
Konstante ist. Nach Definition A.5.1 folgt dann Gleichung 5.2.3, denn die MeBbarkeit 
von E a (Y | X) bezuglich *J(X) ist offensichtlich erf u 1 1 1. 

Theorem 5.2.1 zeigt, daB die Definition der einfachen kausalen reglinearen 
Abhangigkeit die Eigenschaft beinhaltet, daB potentielle Storvariablen die Be- 
ziehung zwischen X und Y nicht modifizieren oder verfalschen und in diesem 
Sinne storen, falls Y von X einfach kausal reglinear abhangig ist. Der gleiche 
Steigungsparameter a Y x gilt diesem Theorem zufolge namlich unabhangig da- 
von, ob solche Variablen konstant sind oder nicht. Mit anderen Worten, die 
Abhangigkeit der Variablen Y von X ist nicht durch andere Variablen konfun- 
diert, wenn Y von X einfach kausal reglinear abhangig ist. Der Steigungskoef- 
fizient a Y x aus Gleichung 5.2.1 charakterisiert dann also eine reine, unkonfun- 
dierte reglineare Abhangigkeit der Variablen Y von X. Die in Theorem 5.2.1 
formulierte Eigenschaft nennen wir daher Unkonfundiertheitsbedingung ein- 
facher kausaler reglinearer Abhangigkeit. 



5.3 Beispiel: Miinzen und Elektromagnet (1. Fortsetzung) 

Wir wenden nun Theorem 5.2.1 auf die in Abschnitt 2.3 beschriebene regli- 
neare Abhangigkeit der ersten von der zweiten Munzvariablen an. In deni 
Wahrscheinlichkeitsraum (Q .^4,P), der die in Abschnitt 2.2 beschriebene drit- 
te Situationsklasse (siehe Tabelle 2.2.3) reprasentiert, gilt zwar fur die beiden 
Munzvariablen Z] und Z n 
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(53.1) £(Z, |Z U ) f t Pio + P,2 Z„ = 0.5666 + 0.1905-Z„ 

(siehe die Gleichungen 2.3.4 bis 2.3.7), und Z u ist Z 1 vorgeordnet, namlich 
nach dem Gesichtspunkt der Handlungsabfolge, aber die durch Gleichung 
5.3.1 beschriebene reglineare Abhangigkeit ist nicht einfach kausal, da die 
Unkonfundiertheitsbedingung nicht erflillt ist. 

Um dies zu zeigen, betrachten wir die stochastische Variable 

ry _ I 1, wenn der Elektromagnet an, 

(5.3.2) Z. M — 1 

[0, wenn er aus ist, 

die der Variablen Z n zeitlich vorgeordnet ist (siehe Abbildung 4.2.1). GemaB 
der im Theorem 5.2.1 formulierten notwendigen Bedingung konnte die durch 
Gleichung 5.3.1 beschriebene reglineare Abhangigkeit nur dann einfach kausal 
sein, wenn z.B. ftir das Ereignis 

(5.3.3) A := {to e Q: Z M (a>) = 1}, 

daB der Elektromagnet angeschaltet ist, die Gleichung 

(5.3.4) £a(Z, I Zn) p = fs oiio + a i 2 Zn, 

mit 0(2 = 0.1905 galte, wenn also auch ftir die einfache lineare Regression der 
Variablen Y unter X gegeben A, der Steigungskoeffizient 0.1905 gelten wlirde. 
Die analoge Aussage wiirde naturlich fur das Ereignis 

(5.3.5) A := {at e Q: Z M (oo) = 0} 

zutreffen. 

Zur Berechnung des tatsachlich gtiltigen Koeffizienten a,, in Gleichung 5.3.4 bilden 
wir ftir das Ereignis 

(5.3.6) B := {to 6 Q: Z,(to) = 1). 

dais die Munze I auf die Metallseite fallt, nach den Gleichungen A.5.2. A.4.3 und A.4.6 
des Anhangs die beiden bedingten Wahrscheinlichkeiten bezliglich des MaBes P A von B 
gegeben Z n = 0 bzw. Z n = 1. 

(5.3.7) £ a (Z, | Z„=0) = P a (B | Z„=0) = a 10 

und 

(5.3.8) £ a ( Zi | Z„=l) = £ a (B | Z„=l) = a 10 + a 12 . 

Bezeichnen wir mit 



(5.3.9) 



C := {co e Q: Z n (to) = 1} 
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und 

(5.3.10) C {co € Q: Zn(u)) = 0} 

die Ereignisse, daK die Munze II auf die Metal I- bzw. Plasti kseite fallt, so erhalten wir 
aus den Daten der Tabelle 2.2.2 die folgenden bedingten Wahrscheinlichkeiten: 

(5.3.11) P a (B | Z„=0) = P( B | Z„=0,Z M =1) = 

_ P(BnC | Z M =1) _ 0.09-0.50 _ 0.09 _ no 
P( C|Z M = 0) 0.10-0.50 OdO 

und 

(5.3.12) P a (B|Z„=1) = P(B|Z„=1,Z m =1) = 

P(BnC I Z M =1) 0.81-0.50 0.81 

P( C|Z M =1) 0.90-0.50 0.90 

Aus den Gleichungen 5.3.7 und 5.3.8 folgt dann 

(5.3.13) a ( o = 0.9 und a 10 + a 12 = 0.9, 
woraus sich a 12 = 0 ergibt. 

Aus a 12 = 0 konnen wir aber schlieBen, daB die Bedingung der Unkonfun- 
diertheit filr die reglineare Abhangigkeit der Variablen Z : von der Variablen Z n 
nicht erf U 1 1 1 ist, denn a 12 = 0 # |3] 2 = 0.1905, d.h. die Steigungskoeffizienten 
der Gleichungen 5.3.1 und 5.3.4 sind nicht identisch, wie es die Unkonfun- 
diertheitsbedingung (siehe Theorem 5.2.1) fordert. Daraus folgt aber, daB die 
reglineare Abhangigkeit der ersten Mtinzvariablen Z : von der zweiten Milnz- 
variablen Z n im Beispiel .Milnzen und Elektromagnet‘ nicht einfach kausal ist, 
ein SchluB, der mit unserer intuitiven Vorstellung wohl voll im Einklang steht. 
Der hier definierte Kausalitatsbegriff ist demnach geeignet, eine kausale Inter- 
pretation der Abhangigkeit der ersten von der zweiten M unzvariablen im 
Beispiel ,Munzen und Elektromagnet 1 auszuschlieBen. Damit ist eine weitere 
Moglichkeit aufgezeigt, wie man uberprufen kann, ob eine reglineare Abhan- 
gigkeit einfach kausal ist. 



5.4 Vollstandige Abhangigkeit 

Bevor wir uns den experimentellen Kontrolltechniken zuwenden, sei eine erste 
hinreichende Bedingung einfacher kausaler reglinearer Abhangigkeit genannt, 
die besagt, daB eine solche Abhangigkeit gegeben ist, wenn auBer der Vorge- 
ordnetheitsbedingung auch gilt, daB Y vollstiindig von X abhangig ist, derart, 
dafi Y = £(Y | X). Damit betrachten wir den Fall, den man umgangssprach- 
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lich als ,deterministisch‘ bezeichnet 15 ). Dabei darf jedoch nicht auBer acht 
gelassen werden, daB es sich auch hier um eine stochastische Abhangigkeit 
stochastischer Variablen handelt. Stochastische Abhangigkeiten sind also in 
dem hier verwendeten Sprachgebrauch (vgl. z.B. Bauer, 1974, S. 137 und S. 
150) nicht unbedingt unvollkommen oder unvollstandig. 



Theorem 5.4.1. Es mogen wieder die Voraussetzungen und Schreibweisen gel- 
ten, die in der Definition der einfachen kausalen reglinearen Abhangigkeit 
aufgeflihrt sind. 

Wenn die Bedingung der Vorgeordnetheit erfiillt ist, und es gilt 

(5.4.1) Y = £(Y | X) = a YO + °yx X, 

dann ist Y von X einfach kausal reglinear abhangig mit dem einfachen kausalen 
reglinearen Effekt a Y x. 



Beweis. AusGleichung 5.4.1 folgt fur jede stochastische Variable W auf (Q ,^4,P) 

(5.4.2) Y = £(Y | X) = a Y0 + a YX X = E ( Y | X,W), 

und E(F | W) = 0, da bereits F = Y - E(Y | X) = 0 ist. Daher gilt aber auch die 
Gleichung 4.4.2 fur jede potentielle Storvariable W, was zu beweisen war. 

Im Fall vollstandiger Abhangigkeit, in der die Gleichung 5.4.1 erfiillt ist, muB 
lediglich daflir gesorgt werden, daB die Bedingung der Vorgeordnetheit erfiillt 
ist. 

Bei vollstandiger Abhangigkeit lassen sich Beispiele konstruieren, die zunachst 
nicht mit unserer Intuition ubereinzustimmen scheinen. Man stelle sich ein 
Experiment ahnlich wie das in Abschnitt 2 beschriebene vor, jedoch mit zwei 
Munzen I und II, in die jeweils auf einer Seite ein Dauermagnet eingebaut ist. 
Auch hier wird zuerst Mttnze 11, dann Miinze I geworfen, wieder auf eine 
Platte, welche die Eigenschaften eines Elektromagneten besitzt. Dieser soil 
nun mit Wahrscheinlichkeit 0.5 in einem von zwei Zustanden sein: In der 
einen Richtung gepolt, sei der Elektromagnet so stark, daB beide Munzen mit 
Wahrscheinlichkeit 1 auf die Seite A fallen, und in der anderen Richtung 
gepolt, sei er ebenfalls so stark, daB die beiden Munzen mit Wahrscheinlich- 
keit 1 auf die Seite B fallen. Die beiden Miinzvariablen 



15 ) Vgl. zu deterministischen Kausal begriffen z.B. Popper (1969, S. 31f.) und Essler 
(1979). 
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(5.4.3) 



und 



I 1, wenn Milnze 1 auf Seite A. 
[0, wenn sie auf Seite B fallt 



(5.4.4) 



I 1, wenn Mtinze II auf Seite A, 
[O, wenn sie auf Seite B fallt. 



sind dann vollstandig abhangig von der Magnetvariablen 

^ ^ ^ ^ J 1, wenn der Elektromagnet in der einen, 

[0, wenn er in der anderen Richtung gepolt ist. 



Dadurch bedingt ist auch die erste Munzvariable Z x vollstandig von der zweiten 
Munzvariablen Z n abhangig. 



Demnach galte dann 

(5.4.6) Zj = £(Z[ | Zn) = 0 + 1 ■ Zjj 

und da die Miinze II zuerst geworfen wird, Z H also Z x vorgeordnet ist, gilt 
dann, daB Z, von Z n einfach kausal reglinear abhangig ist, eine Aussage, die 
zunachst im Widerspruch zu unserer Intuition zu stehen scheint. Wenn man 
allerdings bedenkt, daB sich eine Aussage liber eine einfache kausale reglineare 
Abhangigkeit auf einen ganz bestimmten Wahrscheinlichkeitsraum (Q ,^4,P) 
bezieht, so schwacht sich dieser Eindruck ab. In dem hier zugrundegelegten 
Wahrscheinlichkeitsraum ist namlich tatsachlich immer Z l = 1, wenn Z n = 1 
und Z] = 0, wenn Z n = 0 ist. Der zugrunde gelegte Wahrscheinlichkeitsraum 
ist der Geltungsbereich einer Aussage liber stochastische und daher auch liber 
kausale stochastische Abhangigkeiten, worauf wir ausfuhrlicher in den Ab- 
schnitten 6 und 7 zuriickkommen. 

Der Nachteil der Aussage, daB Z x von Z n in dem hier zugrundegelegten Wahr- 
scheinlichkeitsraum (Q,-c4,P) mit dem Effekt 1.0 einfach kausal reglinear ab- 
hangig ist, besteht nicht darin, daB sie falsch ist, sondern darin, daB der Gel- 
tungsbereich extrem eng ist, d.h. daB der Wahrscheinlichkeitsraum (Q,r^4,P) 
extrem ,,klein“ ist, denn diese Aussage gilt ja nur in der oben beschriebenen 
Situationsklasse, bei welcher der Elektromagnet nur die beiden Zustande 
, stark positiv gepolt‘ und .stark negativ gepolt 1 annehmen kann. Darliber hin- 
aus kann innerhalb dieser Situationsklasse nicht zwischen den Aussagen „Z, ist 
von Z n “ bzw. ,,Z t ist von Z M einfach kausal reglinear abhangig 11 entschieden 
werden, d.h. hier liegt ein Problem der Identifizierbarkeit vor (vgl. z.B. An- 
derson & Rubin, 1956; Fischer, 1966, 1978, und Wiley, 1973). Wttrden wir 
den Wahrscheinlichkeitsraum erweitern, so daB der Elektromagnet auch den 
Zustand ,,aus“ annehmen kann, so galte in diesem groBeren Wahrscheinlich- 
keitsraum nicht rnehr die Aussage, daB Z x von Z n mit dem Effekt 1 einfach 
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kausal reglinear abhangig ist. In diesem groBeren Wahrscheinlichkeitsraum 
wttrde dann nur noch die allgemeinere Aussage gelten, daB die Miinzvariablen 
Zj und Z n beide von der Magnetvariablen Z M kausal stochastisch abhangig 
sind 16 ). 

Der Wahrscheinlichkeitsraum ist ein unverzichtbarer Bestandteil jeder Aussa- 
ge liber stochastische, auch iiber kausale stochastische Abhangigkeiten, eine 
Tatsache, die allzu oft in der psychologischen Literatur vernachlassigt wird, 
wenn beispielsweise davon die Rede ist, daB zwei Variablen in einem bestimm- 
ten AusmaB miteinander korreliert sind. Eine solche Aussage hat nur einen 
Sinn, wenn die Menge der Situationen und der Individuen (und damit der 
Wahrscheinlichkeitsraum), flir die diese Aussage gelten soli, wenigstens impli- 
zit mit angegeben wird. 



5.5 Faktische Konstanthaltung 



Die im Beispiel ,Drogen und Aktivierung‘ bereits angesprochene Einschran- 
kung des Geltungsbereichs auf jeweils eine der beiden Gruppen der Intro- 
bzw. Extravertierten, wlirde man formal dadurch ausdrticken, daB jeweils ein 
verschiedener Wahrscheinlichkeitsraum (Q,-^4,P j) bzw. (Q ,r^4,P 2 ) zugrunde 
gelegt wird. In dem einen betragt dann die Wahrscheinlichkeit, daB eine Per- 
son introvertiert ist, Eins, und daB sie extravertiert ist. Null. In dem anderen 
Wahrscheinlichkeitsraum verhalt es sich genau umgekehrt. Dies kann man 
auch als .faktische Konstanthaltung' der Storvariablen Intro/Extraversion auf- 
fassen. Dabei benutzen wir das Wort ,faktisch‘, um diese Art der Konstanthal- 
tung von der ,statistischen Konstanthaltung' abzugrenzen, auf die wir spater 
noch eingehen werden. 

Die Kontrolltechnik der faktischen Konstanthaltung potentieller Storvariablen hat zwei 
operationale Aspekte, den der Selektion von Beobachtungseinheiten und den der Her- 
stellung gleicher Bedingungen. Bei der Selektion werden z.B. nur introvertierte Oder 
nur extravertierte, nur mannliche Oder nur weibliche Versuchspersonen herangezogen 
etc., womit die Intro/ Extraversionsvari able bzw. die Geschlechtsvariable konstant ge- 
halten wird. Bei der Herstellung gleicher Bedingungen handelt es sich z.B. darum, in 
einer Versuchs- und einer Kontrollgruppe gleiche Beleuchtungsbedingungen herzustel- 
len, so daK die Bel euchtungsvari able konstant gehalten wird. Bei der Selektion handelt 
es sich also darum, bestimmte Versuchspersonen auszuwahlen, und bei der Herstellung 
gleicher Bedingungen werden bestimmte situative Bedingungen ausgewahlt und kon- 
stant gehalten. 



16 ) DieAbhangigkeiten der Miinzvariablen Z, und Z M von der Magnetvariablen Z M 
lieGen sich dann ubrigens auch nicht mehr mit einem reglinearen Modell beschreiben, 
da der Zusammenhang dann nicht mehr linear im Sinne einer Geradenglei chung ware 
(siehe dazu auch die Abschnitte 6 und 7). 
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Mit der Konstanthaltung einer potentiellen Storvariablen W ist garantiert, dafi 
die Gleichung 4.4.2 fur die betreffende Variable W erfiillt ist, wobei allerdings 
zu beachten ist, dafi mit der Konstanthaltung die betreffende Variable W zur 
Konstanten degeneriert ist. 

Der zweifellos sicherste Weg, eine empirische Untersuchung so anzulegen, 
dafi die Invarianzbedingung erfiillt ist, bestande darin, daflir zu sorgen, dafi 
alle potentiellen Storvariablen, jeweils auf einem bestimmten Wert konstant 
sind. In einem solchen Fall ware dann fur jede potentielle Storvariable W die 
Gleichung 4.4.2 erfiillt. Diese hinreichende Bedingung fiir eine einfache kausa- 
le reglineare Abhangigkeit soil im folgenden Theorem festgehalten werden. 



Theorem 5.5.1. Es mogen wieder die Voraussetzungen und Schreibweisen gel- 
ten, die in der Definition der einfachen kausalen reglinearen Abhangigkeit 
aufgefiihrt sind. 

Wenn die Bedingung der Vorgeordnetheit 17 ) erfiillt ist, alle potentiellen Stor- 
variablen konstant sind, und die Gleichung 

(5.5.1) £(Y | X) = a Y o + ctyx X 

gilt, dann ist Y von X einfach kausal reglinear abhangig mit dem einfachen 
kausalen reglinearen Effekt a Y x. 



Beweis. Wenn alle potentiellen Storvariablen W konstant sind, so ist fur alle W auch die 
Gleichung 4.4.2 erfullt, denn E(Y | X) = E(Y | X,W) und E(F | W) = 0, wenn W eine 
Konstante ist, womit die Behauptung bewiesen ist. 

Die auf diesem Theorem beruhende Methode der Konstanthaltung aller 
potentiellen Storvariablen, die wohl auf die ,,Unterschiedsmethode“ von Mill 
(siehe z.B. 1885, S. 91) zuruckgeht, ist jedoch fast nie anwendbar. Selbst bei 
physikalischen Experimenten konnen nicht alle potentiellen Storvariablen 
konstant gehalten werden, denn jedes Ereignis A E ^ 4 , welches der experi- 
mentell manipulierten Variablen X vorgeordnet ist, kann liber die Indikator- 
variable 1 A als potentielle Storvariable W angesehen werden. 

In gewisser Hinsicht ist dieses Theorem allerdings von Bedeutung, denn galte 
es nicht, dann ware die Definition der einfachen kausalen reglinearen Abhan- 
gigkeit wohl unbrauchbar. Variiert nur die Variable X, wahrend alle potentiel- 
len Storvariablen konstant sind, dann mufi die Abhangigkeit zwischen X und 
Y kausal interpretiert werden konnen, falls X der Variablen Y zeitlich vorge- 
ordnet ist. Ein anderes Ergebnis ware mit unserer Intuition wohl kaum zu 
vereinbaren (vgl. z.B. auch McGuigan, 1978, S. 150). 



17 ) Siehe Definition 4.4.1. 
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Die Bedingung der Konstanz alter potentiellen Storvariablen W ist zwar hin- 
reichend, jedoch keineswegs notwendig daflir, daB eine einfache kausale 
reglineare Abhangigkeit der Variablen Y von X besteht. Wenn namlich die 
Bedingung der Vorgeordnetheit vorausgesetzt wird, und auBerdem gilt, daB 
nur solche potentiellen Storvariablen W nicht konstant sind, fiir die gilt, daB 
sie die Gleichung 4.4.2 erflillen, dann ist nach Definition 4.4.1 die 
Invarianzbedingung der reglinearen Abhangigkeit der Variablen Y von X 
ebenfalls gegeben, denn flir eine konstante stochastische Variable W ist die 
Gleichung 4.4.2 trivialerweise erfullt. 

Die hierauf basierende experimentelle Kontrolltechnik der Konstanthaltung 
aller relevanten potentiellen Storvariablen, d.h. aller potentiellen Storvaria- 
blen W, flir die andernfalls die Gleichung 4.4.2 nicht erfullt ware, ist wohl eine 
prinzipiell gangbare Forschungsstrategie. 

Bei dieser Kontrolltechnik ist jedoch zu beachten, daB mit der Konstanthal- 
tung auch die entsprechende Einschrankung des Geltungsbereichs der Aussage 
liber eine stochastische Abhangigkeit verbunden ist, namlich die Einschran- 
kung auf die betreffende Konstanzbedingung. Wird beim Beispiel .Drogen 
und Aktivierung 1 die Intro/Extraversionsvariable konstant gehalten, so bezieht 
sich dann die Aussage liber eine einfache kausale reglineare Abhangigkeit nur 
auf jeweils eine der beiden Gruppen der Intro- bzw. Extravertierten. Auf diese 
mit der Konstanthaltung verbundene Einschrankung des Geltungsbereichs 
werden wir im Abschnitt 7 ausfiihrlicher eingehen. 



5.6 Unabhangigkeit 

Die im Abschnitt 5.5 behandelten Kontrolltechniken der faktischen Konstant- 
haltung sind nicht die einzigen Mittel, die uns zur Verfiigung stehen, um eine 
Untersuchung so anzulegen, daB nach Moglichkeit die beobachtete stochasti- 
sche Abhangigkeit der kausalen entspricht. Andere Kontrolltechniken sind 
z.B. die Randomisierung und die Parallelisierung. In diesem Abschnitt behan- 
deln wir ein Theorem, auf das diese Kontrolltechniken empirischer Untersu- 
chungen basiert werden konnen. 



Theorem 5.6.1. Es mdgen wieder die Voraussetzungen und Schreibweisen gel- 
ten, die in der Definition der einfachen kausalen reglinearen Abhangigkeit 
aufgeflihrt sind. 

Wenn Y von X einfach kausal reglinear abhangig ist, dann gilt fiir jede poten- 
tielle Storvariable W die Gleichung 

( 5 . 6 . 1 ) £[£(F|W)|X] = 0, wobei F := Y-£(Y|X). 
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Beweis. Wenn Y von X einfach kausal reglinear abhangig ist, dann gilt auch die Glei- 
chung 4.4.2, ausder wir wegen der Gleichungen A. 5.7, A.5.10und A. 5.5 

(5.6.2) £[£(Y I X,W) | X] = £(Y | X) = 

f £[«yo + a YX X I X] + £[£(F I W) I X] = 

= a Y0 + a YX X + £[£(F|W)|X], 

erhalten, die nur dann keinen Widerspruch beinhaltet, wenn Gleichung 5.6.1 erfullt ist, 
da £( Y | X) = a Y0 +a YX X, falls Y von X einfach kausal reglinear abhangig ist. 

Zum besseren Verstandnis dieses Theorems iiberlegen wir zunachst, in wel- 
chen Fallen die Gleichung 5.6.1 fur eine potentielle Storvariable erfullt ist. 
Diese Gleichung gilt erstens dann. wenn die Residualvariable F gleich Null ist, 
wenn also Y = a Y o + (Xyx X, d.h. wenn Y vollstandig von X abhangig ist (siehe 
Abschnitt 5.5). Sie ist zweitens aber auch in dem Fall gegeben, wenn F und W 
stochastisch unabhangig sind. oder wenn zumindest 

(5.6.3) £(F | W) = £(F) = 0 

gilt, woraus nach Theorem A. 5. 4 folgt, daB F und W auch unkorreliert sind. 
Diese Situation ist in Abbildung 3.4.2 dargestellt. SchlieBlich ist Gleichung 
5.6.1 drittens auch dann erfullt. wenn W und X stochastisch unabhangig sind, 
denn dann gilt wegen der ^(W)-Mefibarkeit 18 ) von E(F | W), daB auch 
E(F) W) und X stochastisch unabhangig sind, woraus nach Theorem A. 5. 5 
und der Gleichung 

(5.6.4) £[£(F | W)] = £(F) = 0 

ebenfalls die Gleichung 5.6.1 folgt. Aus diesem Grund bezeichnen wir die in 
Theorem 5.6.1 formulierte Eigenschaft als ,Unabhangigkeitsbedingung‘. 

Diese Situation, die man in Experimenten mit den Kontrolltechniken der Ran- 
domisierung und der Parallelisierung herstellt, ist in Abbildung 3.4.1 skizziert. 
Man beachte jedoch, daB die in Theorem 5.6.1 formulierte Unabhangigkeits- 
bedingung schwacher als die stochastische Unabhangigkeit zwischen W und 
X, und auch schwacher als die stochastische Unabhangigkeit zwischen 
£(F | W) und X ist. 



ls ) EinestochastischeVariableZ [im obigen Fall: E(E I W)] heiBt E-mefibar oder meB- 
bar bezuglich der Sigmaalgebra E [im obigen Fall: bezuglich «#(W)] genau dann, wenn 
die von Z erzeugte Sigmaalgebra ^4( Z) Teilmenge von E ist (vgl. z.B. Muller, 1975, S. 
164f.) Diebedingte Erwartung ist so definiert, daft E(E | W) meRbar bezuglich *J( W) 
ist (siehe Definition A.5.1) und aus der stochastischen Unabhangigkeit von W und X 
folgt, der Definition der stochastischen Unabhangigkeit (siehe z.B. Bauer, 1974, S. 
150) gemaK, daK auch E(E | W) und X stochastisch unabhangig sind. 
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Bevor wir ausfiihrlicher auf die Randomisierung eingehen, betrachten wir 
noch die nachstehende Folgerung aus Theorem 5.6.1, die fur die Falsifikation 
einer Aussage, daB Y von X einfach kausal reglinear abhangig ist. verwendet 
werden kann. 



Theorem 5.6.2. Es mogen wieder die Voraussetzungen und Schreibweisen gel- 
ten, die in der Definition der einfachen kausalen reglinearen Abhangigkeit 
aufgeflihrt sind. 

Wenn Y von X einfach kausal reglinear abhangig ist mit 
(5.65) £(Y | X) ^ a Y0 + ctyx X, 

und filr eine potentielle Storvariable W gilt 

(5.6.6) £(F | W) f s a F0 + a FW W, wobei F := Y - £(Y|X), 
dann folgt 

(5.6.7) £(Y | X,W) = (a Y0 + a F0 ) + a YX X + a FW W 
und wenn auBerdem otp^ 7^ 0, dann gilt auch 

(5.6.8) £(W | X) = £(W), 
und daB X und W unkorreliert sind. 



Beweis. Gleichung 5.6.7 folgt direkt aus Definition 4.4.1 und Gleichung 5.6.6. Nach 
den Gleichungen A. 5. 7, A. 5.10 und A. 5.5 erhalten wir aus Gleichung 5.6.7 

(5.6.9) E[E(Y | X,W) | X] = £(Y | X) = Ctyo + a YX X + apo + &FW E ( W I X). 

Da voraussetzungsgemaB Gleichung 5.6.5 gilt, muB auch a F0 = a F w E(W | X) ggelten, 

was unter der Voraussetzung a FW A 0 nur dann zutreffen kann, wenn E(W | X) = 
E(W). Dies aber impliziert nach Theorem A. 3.4, daR X und W unkorreliert sind, 
womit die Behauptung bewiesen ist. 

Aus a FW 0 und einer Korrelation von X und W ungleich Null, konnen wir 
also schlieBen, daB Y von X nicht einfach kausal reglinear abhangig ist, wenn 
wir Gleichung 5.6.6 voraussetzen. Gelten dagegen Gleichung 5.6.7, derzufol- 
ge keine Interaktion zwischen X und W besteht, und Gleichung 5.6.8, welche 
die Unkorreliertheit von X und W impliziert, so modifiziert W nicht die 
Abhangigkeit der Variablen Y von X, d.h. durch die Variable W wird dann 
nicht verhindert, daB die Koeffizienten a YX in den Gleichungen 5.6.5 und 
5.6.7 identisch sind, daB also moglicherweise die reglineare Abhangigkeit der 
Variablen Y von X einfach kausal ist. Eine Anwendung dieses Prinzips bespre- 
chen wir u.a. ini folgenden Abschnitt. 
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5.7 Randomisierung und Parallelisierung 

Die in Gleichung 5.6.1 formulierte Unabhangigkeitsbedingung einfacher kau- 
saler reglinearer Abhangigkeit kann filr viele potentielle Storvariablen W z.B. 
dadurch erflillt werden, daB man bei einer empirischen Untersuchung die 
Kontrolltechnik der Randomisierung anwendet, bei der die Beobachtungsein- 
heiten (Versuchspersonen, -tiere, -gruppen etc.) zufallig auf die verschiedenen 
experimentellen Bedingungen aufgeteilt werden, so daB zwischen den experi- 
mentellen Gruppen hochstens zufallige Unterschiede vor Versuchsbeginn be- 
stehen konnen. Dabei beachte man, daB vorher bestehende systematische Un- 
terschiede zwischen den experimentellen Gruppen sich in einer stochastischen 
Abhangigkeit der unabhangigen Variablen X, welche die Gruppenzugehorig- 
keiten anzeigt, und einer potentiellen Storvariablen W niederschlagen wiirde, 
wie wir nun zeigen. 

1st beispielsweise 

^ _ J 1, wenn die Beobachtungseinheit zur Versuchs- 

[O, wenn sie zur Kontrollgruppe gehort, 

so laBt sich ein Unterschied zwischen den beiden experimentellen Gruppen 
bezliglich des Erwartungswertes einer abhangigen Variablen Y durch die Glei- 
chung 

(5.7.2) £(Y|X) f a Y0 + ctvx X, mit a YX 0 

beschreiben. Wiirde bereits vor der experimentellen Behandlung ein Unter- 
schied bezilglich der abhangigen Variablen zwischen den beiden Gruppen be- 
stehen, so ware nicht ohne weiteres zu entscheiden, ob der Unterschied 
£(Y j X— 1) - £( Y j X=0), der aus 5.7.2 folgen wiirde, auf die experimentelle 
Behandlung, oder aber auf die bereits vorher vorhandenen Unterschiede zu- 
riickzufiihren ist. Bezeichnen wir die abhiingige Variable vor Beginn der expe- 
rimentellen Behandlung mit W, dann galte namlich wegen der Zweiwertigkeit 
von X 

(5.7.3) £(W | X) = a wo + a wx X, mit a wx ^ 0, 

wenn vor der experimentellen Behandlung bereits Unterschiede beziiglich des 
Erwartungswertes der abhangigen Variablen W bestehen. 

Wenn wir von einem reglinearen Zusammenhang zwischen der Residualvaria- 
blen F = Y - E( Y | X) und der abhangigen Variablen W vor der experimentel- 
len Behandlung ausgehen, dann galte auBerdem 

£(F | W) f s ctpo ^fw mit cxp^ ^ 0. 



(5.7.4) 
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Aus den Gleichungen 5.7.2 bis 5.7.4 folgt aber nach Theorem 5.6.2 bereits, 
daB Y nicht von X einfach kausal reglinear abhangig ist. Denn £( W | X) ware 
nach Gleichung 5.7.3 ungleich E(W). Eine reglineare Abhangigkeit der abhan- 
gigen Variablen W vor der experimentellen Behandlung von der unabhangigen 
Variablen X (siehe Gleichung 5.7.3) bei Otp^ 0, wiirde also die Annahme 
einer einfachen kausalen reglinearen Abhangigkeit der Variablen Y von X 
falsifizieren. 

Mit der experimentellen Kontrolltechnik der Randomisierung, d.h. der zufal- 
ligen Aufteilung der Beobachtungseinheiten auf die Versuchsgruppen, erreicht 
man, daB vor Versuchsbeginn keine systematischen Unterschiede zwischen 
den experimentellen Gruppen bestehen, so daB dann X und W stochastisch 
unabhangig sind, und die Gleichung 

(5.7.5) £(W | X) = a wo + 0-X = £(W) 

gilt (vgl. auch Gleichung 5.7.3), da X ja die Zugehorigkeit zu den Versuchs- 
gruppen anzeigt. In diesem Fall ist dann die kausale Interpretierbarkeit durch 
die abhangige Variable vor Versuchsbeginn nicht gefahrdet, wenn man voraus- 
setzt, daB keine Interaktion im varianzanalytischen Sinn zwischen X und W 
besteht, die durch Randomisierung natiirlich nicht ausgeschaltet werden kann. 



Diesen Sachverhalt kann man etwas anders auch folgendermaBen beschreiben, wenn 
wir uns einen Vorgriff auf bisher noch nicht definierte Begriffe erlauben. Angenommen 
die direkten kausalen reglinearen Abhangigkeiten einer Variablen Y von den Variablen 
X und W konnen durch die Gleichung 

(5.7.6) £(Y | X,W) = p Y0 + Pyx X + p YW W 

beschrieben werden, dann impliziert die stochastische Unabhangigkeit der Variablen X 
und W, daB die reglineare Abhangigkeit der Variablen Y von X einfach kausal ist, d.h. 
es gilt dann 

(5.7.7) £(Y|X) t cx Y0 + a yx X, 

wobei a YX = Pyx> denn nach den Gleichungen A. 5.7 und A. 5.10 erhalten wir 
(5.73) E[E{Y | X,W) | X] = £(Y|X) = 

= P Y0 + p YX X + p YW £(W|X) = 
f s [Pyo + Pvw £(W)] + p YX X 
= a Y0 + a YX X, 



da aus der stochastischen Unabhangigkeit von X und W folgt; E(W) X) ^ E(W) 
(siehe Theorem A. 5. 5). 
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Durch Randomisierung, d.h. die zufallige Aufteilung der Beobachtungsein- 
heiten auf die experimentellen Gruppen, kann man flir alle potentielle Storva- 
riablen W erreichen, daB eine stochastische Unabhangigkeit mit X besteht, 
denn die obige Argumentation ist nicht nur dann gliltig, wenn W die abhangi- 
ge Variable gemessen vor der experimentellen Behandlung ist, sondern sie gilt 
ftir jede beliebige potentielle Storvariable W. Durch die Kontrolltechnik der 
Randomisierung wird aber von vornherein sichergestellt, daB die im Theorem 
5.6.1 formulierte notwendige Bedingung einfach kausaler reglinearer Abhan- 
gigkeit, namlich Gleichung 5.6.1, flir viele dieser potentiellen Storvariablen 
erflillt ist. 

Randomisierung ist jedoch keine Garantie dafur, daR eine einfache kausale reglineare 
Abhangigkeit besteht, wie auch das Beispiel ,Drogen und Aktivierung' zeigt, in dem 
der Fall einer Interaktion im varianzanalytischen Sinn besprochen wurde. Solche Inter- 
aktionen einer unabhangigen Variablen X (im Beispiel: der Drogenvariablen) mit einer 
weiteren X gleich- Oder vorgeordneten Variablen W (im Beispiel: der I ntro/ Extraver- 
sionsvariablen) sind hinreichend dafur, daR eine reglineare Abhangigkeit einer Varia- 
blen Y von X nicht einfach kausal ist. Dabei ist es irrelevant, ob diese weitere Variable 
W erhoben wurde Oder nicht. Wichtig ist dabei nur, ob eine solche Interaktion in der 
betreffenden Situationsklasse besteht oder nicht. 

Neben der Kontrolltechnik der Randomisierung lassen sich eventuell vorher 
bestehende Unterschiede zwischen den experimentellen Gruppen bezuglich 
des Erwartungswerts der abhangigen Variablen auch ausschalten, indent man 
die Gruppen bezuglich der abhangigen Variablen W vor der experimentellen 
Behandlung parallelisiert, d.h. durch gezielte Aufteilung der Versuchsperso- 
nen auf die experimentellen Gruppen, bezuglich der Variablen W gleichmacht, 
so daB dann nicht rnehr ^ 0 gilt (siehe Gleichung 5.7.3). Gegeniiber der 
Randomisierung hat die Parallelisierung den Nachteil, daB man mit dieser 
Kontrolltechnik nur ftir diejenige potentielle Storvariable W, bezuglich der 
parallelisiert wird, erreicht, daB die Gleichung 5.6.1 erflillt ist. Mit der Rando- 
misierung hingegen kann man erreichen, daB die Gleichung 5.6.1 fiir alle 
Storvariablen W erflillt ist, wobei keine davon tatsachlich beobachtet werden 
muB. 



5.8 Zusammenfassende Bemerkungen 

In diesem Abschnitt wurden die formalen Eigenschaften des Begriffs der einfa- 
chen kausalen reglinearen Abhangigkeit einer stochastischen Variablen Y von 
einer zweiten stochastischen Variablen X behandelt. Es wurde gezeigt, daB die 
verschiedenen experimentellen Kontrolltechniken auf diese Eigenschaften ba- 
siert werden konnen, ebenso wie Strategien zur Falsifizierung von Aussagen 
iiber einfache kausale reglineare Abhangigkeit in nichtexperimentellen Situa- 
tionen. 
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Als wichtigste formale Eigenschaft wurde bewiesen, daB die Unabhangigkeits- 
bedingung 

(5.8.1) £[£(F|W)|X] f 0 

fur alle potentiellen Storvariablen W gilt, wenn Y von X einfach kausal regline- 
ar abhangig ist. Diese ist z.B. dann erfullt, wenn X und W stochastisch unab- 
hangig sind. 

Auf diese Eigenschaft lassen sich verschiedene experimentelle Kontrolltechni- 
ken basieren. Mit der Randomisierung, d.h. der zufalligen Aufteilung der 
Beobachtungseinheiten auf die beiden experimentellen Gruppen 19 , die durch 
die unabhangige Variable X reprasentiert werden, legt man ein Experiment so 
an. daB X und alle potentielle Storvariablen W stochastisch unabhangig sind, 
so daB dann die Gleichung 5.8.1 erfullt ist, die ja eine notwendige Bedingung 
einfacher kausaler reglinearer Abhangigkeit der Variablen Y von X ist. Mit der 
Parallelisierung beziiglich einer bestimmten potentiellen Storvariablen W 
macht man die experimentellen Gruppen beziiglich W gleich. Da X die Grup- 
penzugehorigkeit reprasentiert, wird damit erreicht, daB X und die betreffende 
Storvariable W stochastisch unabhangig sind. Das gleiche Ziel erreicht man 
auch mit der Konstanthaltung einer potentiellen Storvariablen W, eine Tech- 
nik, die auch dazu fiihrt, daB fiir diese Variable W dann die Gleichung 4.4.2 
gilt. Konstanthaltung ist also die einzige dieser Techniken, die dazu fiihrt, daB 
auch das in Gleichung 4.4.2 enthaltene Interaktionsverbot zwischen X und W 
fiir die konstantgehaltene Variable W erfullt ist. 



6. Miinze und Elektromagnet mit zwei Schaltern 
6. 1 Einleitende Bemerkungen 

In diesem Abschnitt soil die Diskussion der Fragen des Geltungsbereichs Oder 
der externen Validitat (Campbell & Stanley, 1963) einer Aussage fiber kausale 
Abhangigkeiten vorzubereitet werden. Dazu wird das Beispiel .Miinzen und 
Elektromagnet 1 abgewandelt, indem wir einen Elektromagneten betrachten, 
der zwei Schalter hat. Mit jedem dieser Schalter kann man eine gewisse Feld- 
starke des Magneten hinzuschalten. Wenn beide Schalter auf ,Aus‘ stehen, so 
ist der Elektromagnet vollig ausgeschaltet, steht einer der beiden Schalter auf 
,An‘, so hat der Magnet dieselbe Feldstarke, wie im Beispiel des Abschnitts 2, 
und sind beide Schalter an, so ist die Feldstarke doppelt so groB. An diesem 



19 ) Bei mehr als zwei Gruppen braucht man zur Kodierung der Gruppenzugehorigkei- 
ten mehr als nur eine unabhangige Variable X, worauf wir spater ausfuhrlicher eingehen 
werden. 
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Beispiel wollen wir uberpriifen, ob die dabei auftretenden stochastischen Ab- 
hangigkeiten der Miinzwurfergebnisse von den Zustanden des Elektromagne- 
ten durch ein kausales reglineares Modell beschrieben werden konnen. Als 
Alternative wird das logitlineare Modell angeftthrt, das aus der Literatur zur 
Analyse binarer Daten bekannt ist. 



6.2 Beschreibung des Beispiels 

Im Gegensatz zum Beispiel des Abschnitts 2 konnen wir uns hier mit dent 
Werfen einer einzigen Mttnze begniigen, die auf einer Seite aus Plastik und auf 
der anderen Seite aus Metall besteht. Diese Mttnze wird auf eine Platte gewor- 
fen, welche die Eigenschaften eines Elektromagneten hat. Dieser kann in ei- 
nem von vier verschiedenen Zustanden sein: Wahrend die Mttnze geworfen 
wird, sei der Elektromagnet mit der Wahrscheinlichkeit von 0.25 im ersten 
Zustand, in deni er ausgeschaltet ist. AuBerdem nehmen wir an, daB unter 
diesem Zustand, die bedingte Wahrscheinlichkeit, daB die Mttnze auf die Me- 
tallseite fall!, 0.5 betragt (siehe die erste Spalte in Tabelle 6.2.1). 

Tabelle 6.2.1: Die vier Spalten reprasentieren vier Situationsklassen, die je- 

weils mit Wahrscheinlichkeit 0.25 auftreten, in denen beide 
Schalter des Elektromagneten aus, einer der Schalter an und 
beide Schalter an sind, wahrend die Mttnze geworfen wird. 
Die angegebenen Zahlen sind die bedingten Wahrscheinlich- 
keiten, daB die Mttnze auf die Metall- bzw. Plastikseite fallt, 
gegeben eine der vier Bedingungen. 





Schal 

aus 


ter 1 

an 


Schal 

aus 


ter 2 

an 


Schal 

aus 


ter 2 

an 


Mlinze Metallseite 

fnlli- 


0.5 


0.9 


0.9 


0.9878 


auf Plastikseite 


0.5 


0.1 


0.1 


0.0122 



Ebenfalls jeweils mit Wahrscheinlichkeit 0.25 sei der Elektromagnet im zwei- 
ten und dritten Zustand, daB namlich der erste Schalter an und der zweite aus 
bzw. der erste aus und der zweite Schalter an ist, wahrend die Mttnze gewor- 
fen wird. Fttr beide Zustande nehmen wir an, daB die bedingte Wahrschein- 
lichkeit, daB die Mttnze auf die Metallseite fallt, 0.9 betragt. 
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1m vierten Zustand schlieGlich, der ebenfalls mit Wahrscheinlichkeit 0.25 ein- 
treten moge, sind beide Schalter an. Dies kann nun aber nicht bedeuten, daG 
der Effekt 0.9 - 0.5 = 0.4, der festzustellen ist, wenn ein Schalter an ist (siehe 
auch Abschnitt 2), nun einfach verdoppelt sein kann, da sonst das Interval] 
[0,1] fur die bedingte Wahrscheinlichkeit Uberschritten ware, denn 0.5 + 0.4 
+ 0.4 > 1.0. Die Erhohung der bedingten Wahrscheinlichkeit von 0.9, unter 
der Bedingung, daG der erste Schalter an ist, auf eine bedingte Wahrscheinlich- 
keit fur die Bedingung, daG beide Schalter an sind, muG also so erfolgen, daG 
der Betrag von 1.0 nicht uberschritten wild. Wenn man bedenkt, daG sich die 
phy sikalischen Feldstarken der mit den beiden Schaltern kontrollierten 
Magnetfelder aufaddieren, so ist es wohl plausibel, wenn wir die fehlende 
bedingte Wahrscheinlichkeit nach einem Modell festlegen, in dem sich eben- 
falls die Effekte aufaddieren. Ein solches Modell ist das logitlineare Modell, 
nach welchem die in Tabelle 6.2.1 angegebene bedingte Wahrscheinlichkeit 
von 0.9878, gegeben beide Schalter sind an, berechnet wurde. 



Das logitlineare Modell ist aus der Literatur zur statistischen Analyse binarer 
Daten (siehe z.B. Bishop, Fienberg & Holland, 1975, Coleman, 1981, Cox, 
1970 oder Goodman, 1978), aber auch in der Literatur zur Konstruktion 
psychometrischer Tests (siehe z.B. Fischer, 1974, Lord & Novick, 1968, 
Lumsden, 1976 und Rasch, 1960) wohlbekannt. Definieren wir die Mttnz- 
variable 



J 1, wenn die Mttnze auf die Metallseite, 
[0, wenn sie auf die Plastikseite fallt. 



die erste Magnetvariable 



( 6 . 2 . 2 ) 



I 1, wenn der erste Schalter an, 
[0, wenn er aus ist. 



die zweite Magnetvariable 



(6.2.3) 



I 1, wenn der zweite Schalter an, 
[0, wenn er aus ist. 



und das Ereignis 



(6.2.4) 



B := {to 6 Q: Y,(co) = 1}, 



daG die Mttnze auf die Metallseite fallt, so konnen die bedingten Wahrscheinlich- 
keiten in Tabelle 6.2.1 durch das folgende logitlineare Modell erzeugt werden: 

(6.2.5) £(Y, | Xi,X 2 ) = P(B | X„X 2 ) = 

= exp((3ip + fj u Xi + P 12 X 2 ) = 

fs 1 + ex P (p l0 + p n X, + p l2 X 2 ) 
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exp(2.1972-X, 4- 2.1972-X 2 ) 

1 + exp(2.1972 X 1 + 2.1972X 2 ) ' 

Wie man sich leicht iiberzeugen kann, kann man mit dieser Gleichung die 
Daten der Tabelle 6.2.1 bis auf Rundungsfehler reproduzieren. So resultiert 
aus Gleichung 6.2.5 z.B. die bedingte Wahrscheinlichkeit 



( 6 . 2 . 6 ) 



P(B|X 1 = 1,X 2 =1) = 



exp(4.3944) 

1 + exp(4.3944) 



0.9878, 



und auf entsprechende Weise erhalt man die anderen bedingten Wahrschein- 
lichkeiten in Tabelle 6.2.1, die auch so gewahlt wurden, daB sie mit der Glei- 
chung 6.2.5 beschrieben werden kdnnen 20 ). 



6.3 Reglineare Abhangigkeit 

Wir versetzen uns nun in die Lage eines Forschers. der die in Tabelle 6.2.1 
angegebenen Wahrscheinlichkeiten als relative Haufigkeiten einer langen Ver- 
suchsreihe gefunden hat. in welcher der Versuch, die Mttnze zu werfen, wah- 
rend der Elektromagnet mit den angegebenen Wahrscheinlichkeiten in einem 
der vier Zustande ist, sehr oft durchgeftthrt wurde. 

Als erstes wollen wir dabei untersuchen. ob sich die stochastische Abhangig- 
keit der Miinzwurfvariablen Y t von der ersten Magnetvariablen X l als einfache 
kausale reglineare Abhangigkeit beschreiben laBt. Dabei legen wir den Wahr- 
scheinlichkeitsraum (£2,^,/2)ugrunde, der alle vier in Tabelle 6.2.1 aufge- 
fiihrten Situationsklassen, die durch die vier Zustande des Elektromagneten 
charakterisiert sind. als Unterklassen enthalt, d.h. (Q soil den gesamten 
Versuch reprasentieren. 

Die bedingte Wahrscheinlichkeit, daB die Mttnze auf die Metallseite fallt, gege- 
ben der erste Schalter ist an, betragt dann 0.9439, und die entsprechende 
Wahrscheinlichkeit, gegeben der erste Schalter ist aus, betragt dann 0.7. Diese 
Daten sind noch einmal in einer etwas anderen Art als in Tabelle 6.2.1 in der 
Tabelle 6.3.1 dargestellt, aus der nun auch zu ersehen ist, daB die beiden 
Magnetvariablen X t und X 2 , welche die Schalterstellungen anzeigen, stocha- 
stisch unabhangig sind. 



20 ) Ob sich die Daten eines entsprechenden echten physikalischen Experiments tatsach- 
lich durch ein logitl ineares Modell beschreiben lassen, ist wohl eine empirische Frage, 
und hier letztlich irrelevant, da dieses Beispiel nur dazu dient, Grundgedanken kausaler 
reglinearer und logitlinearer Modellezu erlautern, und die Diskussion der Fragen 
externer Validitat im nachsten Abschnitt vorzubereiten. 
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Tabelle 6.3.1: Vier Situationsklassen, die jeweils mit Wahrscheinlichkeit 0.25 

auftreten, in denen beide Schalter des Elektromagneten aus, 
einer der Schalter an und beide Schalter an sind, wahrend die 
Miinze geworfen wird. Die angegebenen Zahlen im Innern der 
Tabelle sind die bedingten Wahrscheinlichkeiten, dafi die 
Miinze auf die Metallseite fallt gegeben eine der vier Bedin- 
gungen. In Klammern sind die Wahrscheinlichkeiten ftir das 
Auftreten der vier Situationsklassen und deren Vereinigungen 
angegeben. 





Scha 

an 


ter 2 

aus 




an 


0.9878 (0.25) 


0.9 (0.25) 


0.9439 (0.5) 


Schalter 1 

aus 


0.9 (0.25) 


0.5 (0.25) 


0.7 (0.5) 




0.9439 (0.5) 


0.7 (0.5) 


(1.0) 



Wegen der Zweiwertigkeit von X t laBt sich die stochastische Abhangigkeit der 
Munzvariablen Y | von X t durch 

(6.3.1) 7 5 (B|X 1 )= a, 0 + a„ X, = 0.7 + 0.2439 -Xj 

als reglineare Abhangigkeit beschreiben, wobei wir die numerischen Werte der 
Koeffizienten aus den beiden Gleichungen 

(6.3.2) P(B I Xj = l) = a 10 + a n = 0.9439 
und 

(6.3.3) P(B|X 1 = 0) = a 10 = 0.7 

erhalten, die beide aus Gleichung 6.3.1 nach den Gleichungen A. 5. 2, A. 4. 6 
und A. 4. 3 des Anhangs folgen. 

In diesem Beispiel konnen wir eine eindeutigezeitlicheGeordnetheit der Variablen 
voraussetzen, denn die beiden Magnetvariablen sind der Versuchsanlage gemaK der 
Munzvariablen vorgeordnet. Falls in diesem Beispiel die Invarianzbedingung fur die 
durch Gleichung 6.3.1 beschriebenen reglinearen Abhangigkeit gegeben ware, konnten 
wir diese Abhangigkeit auch kausal interpret eren und den Koeffizienten a n als einfa- 
chen kausalen reglinearen Effekt von X 2 auf Yi bezeichnen. Die Bedingung der Inva- 
rianz ist jedoch nicht erfullt, wie wir nun anhand des Theorems 5.4.1 verifizieren. 

Offensichtlich besteht in diesem Beispiel eine Interaktion im varianzanalyti- 
schen Sinn zwischen der ersten und der zweiten Magnetvariablen X t bzw. X 2 . 
Ein multiples reglineares Modell mit Interaktion. welches die Abhangigkeiten 
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von unter alien vier Zustanden des Elektromagneten beschreibt, ist dem- 
nach 

(6.3.4) E(Y, | X„X 2 ) = P(B | X 1 ,X 2 ) Tt 

= 0.5 + 0.4-X! + 0.4-X 2 + (— 0.3122)-X 1 -X 2 , 

wobei wir die numerischen Werte auf analoge Weise wie beim Modell mit 
einer einzigen unabhangigen Variablen erhalten. nur da8 wir hier vier Glei- 
chungen mit vier Unbekannten zu losen haben. 

Nicht nur mit dent logitlinearen Modell (siehe Gleichung 6.2.5), sondern auch 
mit diesem reglinearen Modell mit Interaktion lassen sich die stochastischen 
Abhangigkeiten der Miinzvariablen Y t von den beiden Magnetvariablen X[ 
und X 2 perfekt beschreiben, denn auch mit Gleichung 6.3.4 konnen die in 
Tabelle 6.2.1 angegebenen bedingten Wahrscheinlichkeiten exakt reproduziert 
werden. Die in diesem reglinearen Modell vorkommenden Parameter lassen 
sich jedoch nicht kausal interpretieren, da die in Definition 4.4. 1 formulierte 
Invarianzbedingung nicht erflillt ist. Zum einen bleibt namlich der Parameter 
Otn = 0.2439 aus Gleichung 6.3.1 bei der Erweiterung von E(Y l | X , ) auf 
E(Y! | Xj,X 2 ) nicht invariant, denn in Gleichung 6.3.4 hat X t nicht den Koeffi- 
zienten 0.2439, sondern 0.4, und zum zweiten kommt in Gleichung 6.3.4 der 
Interaktionsparameter -0.3122 vor, der nach Theorem 5.4.1 gleich Null sein 
mttfite. Schon eine dieser beiden Tatsachen aber geniigt, um die Annahme zu 
falsifizieren, daB Y[ von X t auf deni Wahrscheinlichkeitsraum (Q,^4,P) ein- 
fach kausal reglinear abhangig ist, wobei (Q ,*d,P) den gesamten Versuch re- 
prasentiert. 

Der in Gleichung 6.3.4 vorkommende Interaktionsparameter ist in gewisser 
Weise artifiziell, da es ein anderes Modell gibt, welches ohne einen solchen 
Parameter auskommt, namlich das logitlineare Modell der Gleichung 6.2.5. In 
diesem Modell verhalten sich die beiden Parameter additiv, was in besserer 
Ubereinstimmung mit unserem physikalischen Wissen liber die Additivitat der 
Feldstarken von Magneten steht. 

Dieses Beispiel illustriert noch einmal die in der Definition 4.4.1 formulierte Eigen- 
schaft, dal$ einereglineareAbhangigkeit einer Variablen Y von X immer dann nicht 
einfach kausal ist, wenn eine Interaktion von X mit potentiellen Storvariablen W (im 
Beispiel: der zweiten Magnetvariablen) besteht. Ein moglicher Weg ware nun, die 
Aussage, daK die Munzvariable Y 2 einfach kausal reglinear von der ersten Magnetvaria- 
blen X 2 abhangig ist, auf jeweils eine der beiden Bedingungen, daK der zweite Schalter 
an bzw. aus ist, einzuschranken, so daK fur jede dieser beiden Situationen ein unter- 
schiedlicher einfacher kausaler reglinearer Effekt der ersten Magnetvariablen auf die 
Munzvariable angenommen wird, worauf wir ausfuhrlicher im Abschnitt 7 eingehen 
werden. Die Bedingung der Invarianz konnte dann jeweils innerhalb dieser beiden 
Situationsklassen uberpruft werden, indem man nach anderen potentiellen Storvaria- 
blen sucht und pruft, ob fur diese die Invarianzbedingung erf u 1 1 1 ist. 
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6.4 Logitlineare Abhangigkeit 



Angenommen, wir wiiBten nichts von der zweiten Magnetvariablen X 2 und 
wollten die Abhangigkeit der Miinzvariablen Y , von der ersten Magnetvaria- 
blen X[ durch ein einfaches logitlineares Modell beschreiben. Bezeichnen wir 
das Ereignis, daB die Miinze auf die Metallseite fallt, weiterhin mit 

(6.4.1) B : = (a) e Q: Y,(w) = 1}, 



so gilt dann die Gleichung 



(6.4.2) 



£(Yi | X,) ^ P(B|X,) f 



exp(Yio + Yu XQ 
1 + exp(Yi 0 + Yn X,) 



Aus den daraus folgenden beiden bedingten Wahrscheinlichkeiten P(B | X t = 0) 
und P(B | X t = 1) erhalten wir nach einigen algebraischen Umformungen die 
folgenden beiden Gleichungen: 



(6.4.3) 



Yio = In 



P(BlX t =0) 

.1 - P(B | X, = 0X 



= In [07/(1 - 0.7)] = 0.8473 



und 

(6.4.4) 



Yio + Yu = In 



P(B|X, = 1) 

.1 - P( B|X, = 1X 



= In [0.9439/(1 - 0.9439)] = 2.8229. 



Daraus ergibt sich der Koeffizient Yu = 1-9756, der nicht mit |3n = 2.1972 aus 
Gleichung 6.2.5 identisch ist. 



Hierin bestehtein wichtiger Unterschied zum reglinearen Modell. Obwohl X x und X 2 
stochastisch unabhangig sind (sieheTabelle 6.3.1), darf man X 2 im logitlinearen Fall 
offenbar nicht ignorieren, denn sonst kann man den tatsachlichen kausalen Effekt (hier: 
(3„ =2.1972) nicht korrekt bestimmen. Im Fall einer einfachen kausalen reglinearen 
Abhangigkeit konnte man X 2 ignorieren, und wurde dennoch den einfachen kausalen 
reglinearen Effekt von X 2 auf Y x korrekt ermitteln, falls X 2 und X 2 stochastisch unab- 
hangig sind. Diese besonders vorteilhafte Eigenschaft, auf die wir die Kontrolltechnik 
der Randomisierung basieren konnen (sieheAbschnitt 5.7), giltim Fall logitlinearer 
Abhangigkeit offenbar nicht. Bei multipler logitlinearer Abhangigkeit (siehe Gleichung 
6.2.5) ist Randomisierung anscheinend kein Verfahren, das dazu beitragen kann, eine 
kausale Interpretation einer solchen logitlinearen Abhangigkeit zu ermoglichen. Offen- 
bar muK man im logitlinearen Fall statt dessen auf die Kontrolltechnik der Konstanthal- 
tung (hier: der zweiten Magnetvariablen) zuruckgreifen, worauf wir ausfuhrlicher im 
Abschnitt 7 eingehen. 
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6.5 Zusammenfassende Bemerkungen 

In diesem Abschnitt wurde ein Beispiel dargestellt, in dem das Ergebnis des 
Werfens einer Mlinze durch zwei Schalter eines Elektromagneten beeinfluBt 
werden kann. In diesem Beispiel laBt sich die Abhangigkeit der Miinzvariablen 
Y] von den beiden Magnet variablen X! u n d X 2 , welche jeweils die Schalterstel- 
lungen angeben, sowohl durch ein reglineares Modell mit Interaktion zwi- 
schen den beiden Magnetvariablen beschreiben, als auch durch ein logitlineares 
Modell, in dem keine solche Interaktion vorkommt. Die Interaktion im regli- 
nearen Modell kann daher in diesem Beispiel als modellbedingt oder artifiziell 
bezeichnet werden. Wegen der Interaktion zwischen Xj und X 2 ist in diesem 
Beispiel die Munzvariable Y] nicht von einer der Magnetvariablen X! oder X, 
einfach kausal reglinear abhangig. 

Versucht man die Abhangigkeit der Miinzvariablen Y! z.B. von der ersten 
Magnetvariablen Xj durch ein einfaches logitlineares Modell zu beschreiben, 
so erhalt man dabei einen anderen Parameter als denjenigen, mit dem im 
Modell mit beiden Magnetvariablen X! und X 2 die Daten erzeugt wurden, 
obwohl die beiden Magnetvariablen stochastisch unabhangig sind. Hierin be- 
steht ein wichtiger Unterschied zwischen logitlinearer und reglinearer Abhan- 
gigkeit, denn beim reglinearen Fall ist die stochastische Unabhangigkeit von 
X, und X 2 hinreichend daflir. daB X 2 die Beziehung zwischen Y und Xj nicht 
modifiziert, falls auch keine Interaktion zwischen X] und X 2 besteht (siehe 
Abschnitt 5.6). 

In diesem Beispiel kann weder die einfache reglineare, noch die einfache logit- 
lineare Abhangigkeit als kausal bezeichnet werden, wenn man einfache kausale 
logitlineare Abhangigkeit analog zur einfachen kausalen reglinearen Abhangig- 
keit definieren wurde. Als Ausweg bleibt in einem solchen Fall nur die Ein- 
schriinkung des Geltungsbereichs der Modelle mit einer einzigen unabhangigen 
Variablen auf jeweils eine der beiden Situationen, daB der zweite Schalter des 
Elektromagneten an oder aber aus ist, worauf wir ausflihrlicher u. a. im folgen- 
den Abschnitt eingehen werden. 



7. Externe Validitat 

7.1 Einleitende Bemerkungen 

Der Begriff der externen Validitat wurde neben dem der internen Validitat 
(siehe Abschnitt 3) als das zweite fundamentale Gutekriterium flir eine empiri- 
sche Untersuchung von Campbell (siehe z.B. Campbell, 1957, Campbell & 
Stanley, 1963) eingeflihrt: ,, Externe Validitat fragt nach der Generalisierbar- 
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keit: Auf welche Populationen, situativen Bedingungen, Behandlungs- und 
MeBvariablen kann dieser Effekt verallgemeinert werden?“ (Campbell & Stan- 
ley, 1963, S. 175, Ubersetzung durch den Autor). 

Sieht man von den bereits von Gadenne (1976) und spater auch von Breden- 
kamp (1979, 1980) kritisierten induktivistischen Formulierungen ab, so ver- 
bergen sich in der Tat hinter dieser Bezeichnung zwei Fragen, die einer explizi- 
ten Diskussion bedilrfen: Zum einen die Frage nach dem Geltungsbereich einer 
Aussage iiber eine kausale stochastische Abhangigkeit, und zum anderen die 
Frage nach der Variablenvaliditat, also die Frage: ,,Wie gut reprasentieren die 
Variablen einer Untersuchung das jeweils Gemeinte?“ (Bredenkamp, 1980, 
S. 31). 

Zur Losung der zweiten Frage ist die Theorie latenter Variablen von Bedeu- 
tung, iiber die Moosbrugger (1982) in diesem Band einen Uberblick gibt. In 
diesem Abschnitt werden wir nur auf die Frage nach dem Geltungsbereich 
naher eingehen. Beziiglich des Problems der Variablenvaliditat miissen wir 
dabei voraussetzen, daB die jeweils betrachteten Variablen tatsachlich die in 
einer Untersuchung gemeinten sind. Dabei miissen diese Variablen keineswegs 
direkt beobachtbar oder , manifest 1 sein, statt dessen kann es sich ebensogut 
um .latente 1 , nicht direkt beobachtbare Variablen handeln. 

Auch die verbliebene Frage nach dem Geltungsbereich kann in zwei verschie- 
dene Aspekte untergliedert werden, den der Situationsvaliditat und den der 
Populationsvaliditat, die wir in den folgenden beiden Abschnitten behandeln 
werden. 1m letzten Abschnitt zeigen wir dann, wie zwei verschiedene Modelle 
hinsichtlich ihrer .externen Validitat 1 bzw. ihres Geltungsbereichs miteinander 
verglichen werden konnen. 



7.2 Situationsvaliditat 

Der erste Aspekt der externen Validitat, den wir hier behandeln wollen, ist der 
der ,, Situationsvaliditat 11 (Hager & Westermann, 1982) oder der ,,okologischen 
Validitat 11 (Bredenkamp. 1979, 1980; Brunswik, 1956). Bei diesem Gesichts- 
punkt der externen Validitat handelt es sich um die Frage, ftir welche Situa- 
tionsklassen oder ,, situativen Bedingungen 11 eine kausale stochastische Abhan- 
gigkeit behauptet werden kann. Wir zeigen nun, wie diese Fragen in der hier 
vorgestellten Theorie behandelt werden konnen. 

Dabei gehen wir von dem im Abschnitt 6 beschriebenen Beispiel aus. Dort 
hatten wir festgestellt, daB die reglineare Abhangigkeit der Munzvariablen Yj 
von der ersten Magnetvariablen Xj nicht einfach kausal ist, wenn wir den 
Wahrscheinlichkeitsraum (Q,^,/^ugrunde legen, der die Situationsklasse 
reprasentiert, in welcher der zweite Schalter mit Wahrscheinlichkeit 0.5 an 




Modelle zur kausalen Erklarung statistischer Zusammenhange 



125 



bzw. aus ist, und als einen Ausweg haben wir dort erwogen, den Geltungsbe- 
reich der Aussage jeweils auf eines der beiden Ereignisse 

(7.2.1) A := {a) 6 Q: X 2 (io) = 1}, 
daB der zweite Schalter an ist, bzw. 

(7.2.2) A := {(0 e Q: X 2 (co) = 0}, 

daB der zweite Schalter aus ist, einzuschranken, oder mit anderen Worten, den 
zweiten Schalter konstant zu halten. Formal konnen wir dies dadurch aus- 
drlicken, daB wir nicht mehr den Wahrscheinlichkeitsraum ( Q,\=4,P ), sondern 
die Wahrscheinlichkeitsraume (Q bzw. (Q,k?4,Px) zugrunde legen, wo- 
bei die WahrscheinlichkeitsmaBe P A und P A durch 



(7.2.3) 


Pa(B) : 


= 


P( B|A) 


:= P(AnB)/P(A), 




fiir alle 


B 




P{ A) > 0, 


bzw. 










(7.2.4) 


pm ■ 


= 


p(b|A) 


= P(AnB)/P(A), 




fiir alle 


B 


G 


P(A) > o, 



definiert sind, vorausgesetzt, daB die Wahrscheinlichkeiten von A und A grb- 
Ber Null sind. 

Bezeichnen wir mit 

(7.2.5) B := {(JD G Q: Y,(to) = 1} 

das Ereignis, daB die Miinze auf die Metallseite fallt, dann gilt beispielsweise 
unter der Bedingung, daB der zweite Schalter aus ist, ftir die bedingte Erwar- 
tung der Miinzvariablen Y, unter der ersten Magnetvariablen X, beziiglich des 
MaBes Pa die Gleichung 21 ) 

(7.2.6) £ A (Y,|X,)= fs Pa(B|x,) p = s (3,0 + |3„ x, = 0.5 + 0.4-X,, 

wobei man die numerischen Werte der Koeffizienten aus der Tabelle 6.2.1 
durch Bildung der bedingten Erwartungswerte £a(Y, | X,=0) = Pa(B | X,=0) 
und £a(Y, |X, = 1) = £a(B |X, = 1) und Losung der resultierenden beiden 
Gleichungen 

(7.2.7) (3,0 = £ S (B I X,=0) = P( B I X,=0, X 2 =0) = 0.5 

21 ) Das Zeichen, n = ‘ in Gleichung 7.2.6 heiBt ,fast sicher beziiglich des Wahrschein- 

i ^ IS 

lichkeitsmaBes PfJ (siehe die Bemerkungen zu Definition A.5.1). 
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und 

(7.2.8) (3 10 + (3„ = Pa(B|X, = 1) = P(B|X, = 1, X 2 =0) = 0.9 

nach den zwei unbekannten Koeffizienten erhalt. 

Auf analoge Weise resultiert dann fur die Bedingung A die folgende Gleichung fur die 
bedingte Erwartung E^Y, | XJ bezuglich des WahrscheinlichkeitsmaRes P A 

(7.2.9) E a ( Y, I X,) p = s 0.9 + 0.0878'X, . 

Dies bestatigt noch einmal das in Abschnitt 6.3 gefundene Ergebnis, daR Y x von X x 
nicht einfach kausal reglinear abhangig ist, denn die Koeffizienten aus den Gleichungen 
7.2.6 und 7.2.9 sind nicht identisch, wie es der Definition der einfachen kausalen 
reglinearen Abhangigkeit gemaR der Fall sein muRte. Der Koeffizient a,, = 0.2439 aus 
Gleichung 6.3.1 laRt sich also nicht als einfacher kausaler reglinearer Effekt von X, auf 
Y 2 interpretieren, wenn wir den Wahrscheinlichkeitsraum (Q ,^4,P) zugrunde legen, 
der den gesamten Versuch reprasentiert; er kann lediglich als Durchschnitt der beiden 
kausalen einfachen reglinearen Effekte 0.4 und 0.0878 aus den Gleichungen 7.2.6 und 
7.2.9 bezeichnet werden. 

Schranken wir den Geltungsbereich unserer Aussage liber eine einfache kausa- 
le reglineare Abhangigkeit der Variablen Y, von X, auf jeweils eine der beiden 
Bedingungen A bzw. A ein, indent wir anstelle des Wahrscheinlichkeitsraums 
(Q jeweils die Wahrscheinlichkeitsraume (£ 2,r^4,P A ) bzw. (Q,*?4,P A ) ZU- 
grunde legen. so sprache wohl nichts dagegen, die durch die Gleichungen 7.2.6 
und 7.2.9 beschriebenen Abhangigkeiten jeweils kausal zu interpretieren. Ent- 
sprechend ist aber der Geltungsbereich d i eser Aussagen auf die Bedingungen A 
bzw. A ei n g esch ran kt, Oder, etwas formaler formuliert, auf die Wahrschein- 
lichkeitsraume bzw. (Q ,^4,P A ), die beide in dent groBeren Wahr- 

scheinlichkeitsraum (Q,-&4,P) enthalten sind (siehe die Gleichungen 7.2.3 und 
7.2.4), der ja den gesamten Versuch reprasentiert. 

Die F rage, unter welchen situativen Bedingungen Oder in welchen Situations- 
klassen eine kausale stochastische Abhangigkeit gilt, ist also gleichbedeutend 
damit, welcher Wahrscheinlichkeitsraum zugrundegelegt wird. Dabei beachte 
man, daB innerhalb der hier vorgestellten Theorie die Frage nach der Situa- 
tionsvaliditat nur ein Aspekt der Frage nach der Kausalitat einer Abhangigkeit 
zwischen zwei Variablen ist, der eigentlich gar nicht von der Frage nach der 
Kausalitat zu trennen ist. Eine vollstandige Aussage liber eine einfache kausale 
reglineare Abhangigkeit lautet namlich: .Die stochastische Variable Y ist von 
der stochastischen Variablen X auf dent Wahrscheinlichkeitsraum (Q,^4,P) 
einfach kausal reglinear abhangig mit dent einfachen kausalen reglinearen Ef- 
fekt OCyx'- E> as Entscheidende dabei ist, daB der Geltungsbereich, den der 
Wahrscheinlichkeitsraum (Q ,-*J,P) reprasentiert, selbst bereits unverzichtba- 
rer Bestandteil der Aussage ist. Ohne den Bezug auf einen ganz bestimmten 
Wahrscheinlichkeitsraum ist eine solche Aussage vollig inhaltsleer, da dann die 
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dabei benutzten Begriffe undefiniert waren. Eine stochastische Variable bei- 
spielsweise ist ja nur fur einen ganz bestimmten Wahrscheinlichkeitsraum defi- 
niert (siehe z.B. Bauer, 1974, S. 137), der in Anwendungen jeweils eine ganz 
bestimmte Situationsklasse reprasentiert. 

Dies soil aber nicht bedeuten, daK man sich nicht fragen kann, ob die fur einen Wahr- 
scheinlichkeitsraum (eine Situationsklasse) gultige stochastische Abhangigkeit, Oder ge- 
nauer, der dabei gultige Steigungskoeffizient der einfachen linearen Regression, nicht 
auch in einem anderen Wahrscheinlichkeitsraum gultig ist. Bei der Fragenach der 
Situationsvaliditat geht es also darum, den Oder die Wahrscheinlichkeitsraume zu spezi- 
fizieren, die man bei einer Aussage uber eine einfache kausale reglineare Abhangigkeit 
zugrunde legen will, wenn wir von einem einfachen reglinearen Modell ausgehen. 

7.3 Populationsvaliditat 

Ein in formaler Hinsicht mit der .Situationsvaliditat' vollig identisches Pro- 
blem, ist der zweite Aspekt der externen Validitat, namlich das Problem der 
,, Populationsvaliditat" (Bredenkamp, 1979, 1980, Hager & Westermann, 
1982). Dies soil nun etwas ausfiihrlicher erlautert werden. 

Dazu modifizieren wir das im letzten Kapitel behandelte Beispiel wie folgt: 
Wir betrachten zwei Mttnzen I und II, die beide auf jeweils einer Seite aus 
Plastik bzw. Metall bestehen. Mit diesen Miinzen wird der folgende Versuch 
durchgefiihrt: Zuerst wird aus einer Urne nach Zufall eine der beiden Miinzen 
gezogen, so daB jede die Wahrscheinlichkeit 0.5 hat, gezogen zu werden. 
Dann wird die gezogene Miinze auf eine Platte geworfen, welche die Eigen- 
schaften eines ein- und ausschaltbaren Elektromagneten hat, der ebenfalls mit 
Wahrscheinlichkeit 0.5 an oder aus ist, und zwar unabhangig davon, welche 
Miinze gezogen und geworfen wird (siehe Tabelle 7.3.1). 

Im Gegensatz zum Beispiel des Abschnitts 2 soil es sich jedoch nicht um zwei 
physikalisch gleiche Miinzen handeln, sondern die Miinzen sollen auf der 
Metallseite verschieden schwer sein, mit dem Effekt, daB sie mit unterschied- 
lichen Wahrscheinlichkeiten auf die Metallseite fallen. Wenn der Elektro- 
magnet aus ist, sei fiir die erste Miinze die bedingte Wahrscheinlichkeit 0.5, auf 
die Metallseite zu fallen, und fiir die zweite betrage diese bedingte Wahr- 
scheinlichkeit 0.9. Der Elektromagnet sei ebenso stark wie im Beispiel des 
Abschnitts 2, so daB die bedingte Wahrscheinlichkeit, fiir die Miinze I auf die 
Metallseite zu fallen, wenn der Elektromagnet an ist, wieder 0.9 betragt, und 
fiir die zweite Miinze 0.9878. Damit haben wir die gleichen Daten wie in 
Tabelle 6.2.1 vorliegen, die hier jedoch inhaltlich anders strukturiert sind. Die 
Stelle verschiedener Situationen, die durch die Stellung des zweiten Schalters 
gekennzeichnet sind, wird nun von unterschiedlichen Miinzen eingenommen, 
und statt zu fragen, in welchen Situationen eine bestimmte kausale stochasti- 
sche Abhangigkeit gilt, konnen wir nun fragen, fiir welche Population oder 
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Tabelle 7.3.1: Die Spalten reprasentieren vier Situationsklassen, die jeweils 

mit Wahrscheinlichkeit 0.25 auftreten. In der ersten und 
zweiten wird Mttnze I gezogen und der Schalter des Elektro- 
magneten ist aus bzw. an. In der dritten und vierten Situa- 
tionsklasse wird Mttnze II gezogen und der Schalter ist aus 
bzw. an. Die angegebenen Zahlen sind die bedingten Wahr- 
scheinlichkeiten, daB die geworfene Mttnze auf die Metall- 
bzw. Plastikseite fallt. 





Gezoge 

Mttnze I 


n wird 

Mttnze II 


Schc 

aus 


liter 

an 


Schc 

aus 


liter 

an 


Mttnze Metallseite 


0.5 


0.9 


0.9 


0.9878 


auf Plastikseite 


0.5 


0.1 


0.1 


0.0122 



Menge von Mttnzen eine solche stochastische Abhangigkeit behauptet werden 
kann. 

Es ist offensichtlich. daB wir hier auf eine Analogie zwischen Mttnzen und Versuchs- 
personen abzielen. Wie wir im Abschnitt 7.2 gesehen haben. konnen sich auch Mttnzen 
in unterschiedlichen Situationen verschieden ,verhalten‘ und in diesem Abschnitt ist 
deutlich geworden, daB Mttnzen auch unterschiedliche Eigenschaften haben konnen, 
was natttrlich um so mehr fttr Personen oder Gruppen gilt. Dies unterstreicht die 
Wichtigkeit, den W ahrschei n I ichkei tsrau m bei einer Aussage ttber eine stochastische 
Abhangigkeit mitanzugeben, denn dieser reprasentiert SOWOhl die Situationsklasse, fur 
welche die Abhangigkeit behauptet wird, als auch die Population, wie wir im folgenden 
zeigen wollen. Die in der Experimentellen Psychologie ttbliche genaue Beschreibung 
der Untersuchungssituation und die genaue Charakterisierung der beteiligten 
Versuchspersonen, komrnt dieser Forderung nach einer moglichst exakten Beschrei- 
bung des zugrunde gelegten Wahrscheinlichkeitsraums bereits weitgehend entgegen. 

Wir zeigen nun, daB auch die Frage, auf welche Population (in unserem Bei- 
spiel: von Mttnzen) sich eine Aussage ttber eine kausal reglineare Abhangigkeit 
bezieht, durch die Angabe des zugrunde gelegten Wahrscheinlichkeitsraums 
beantwortet wird. 

Definieren wir die Munzwurfvariable 

^ y _ I 1, wenn die gewahlte Mttnze auf die Metallseite, 

1 0, wenn sie auf die Plastikseite fallt, 
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die Magnetvariable 



(7.3.2) X! := 
die Mlinzwahlvariable 

(7.3.3) Xj := 



{ 1, wenn der Elektromagnet an-, 
0, wenn er ausgeschaltet ist. 



I 1, wenn Miinze I, 

[ 0, wenn Miinze II gewahlt wird. 



und das Ereignis 

(7.3.4) B := {co 6 £2: Y,(co) = 1}, 



daB die geworfene Miinze auf die Metallseite fallt, so gelten fiir diese Variablen, 
wenn auch mit anderer Interpretation, dieselben Gleichungen wie in den Abschnit- 
ten 6.2 bis 6.4. 



Wir konnen uns auch hier die Frage stellen, ob die reglineare Abhiingigkeit der 
Miinzwurfvariablen Y, von der Magnetvariablen Xj einfach kausal ist, wenn wir 
den Wahrscheinlichkeitsraum (Q,^,/£)ugrunde legen, der den gesamten Ver- 
such reprasentiert, der also diejenige Situationsklasse beschreibt, in der die 
beiden Miinzen jeweils die Wahrscheinlichkeit 0.5 haben, aus der Urne gezo- 
gen zu werden. Auch fiir dieses Beispiel finden wir, daB die in Definition 4.4.1 
formulierte Invarianzbedingung nicht erflillt ist, denn es gilt auch hier die 
Gleichung 

(7.3.5) = P(B|X 1; X 2 ) = 

= 0.5 + 0.4-Xj + 0.4-X 2 + (— 0.3122)-X 1 -X 2 . 

Da der Interaktionsparameter -0.3122 und nicht 0 betriigt, ist auch hier zu 
schlieBen, daB Y , von X t nicht einfach kausal reglinear abhangig ist. 

Wir konnen nun den Geltungsbereich der Aussage jeweils auf eine der beiden 
Bedingungen 

(7.3.6) A := Miinze I wird gewahlt 
bzw. 

(7.3.7) A := Miinze II wird gewahlt 

einschranken, oder mit anderen Worten, auf jeweils eine der beiden Miinzen 
begrenzen. Formal drlicken wir dies dadurch aus, daB wir nicht mehr den 
Wahrscheinlichkeitsraum (£2,*z4,P), sondern die Wahrscheinlichkeitsraume 
(Q,*4,P a ) bzw. (Q,*J,P a ) zugrunde legen, wobei die Wahrscheinlichkeitsma- 
6e P A und P A analog wie im letzten Abschnitt definiert sind. In dem Wahr- 
scheinlichkeitsraum (Q,^,P a ), d.h. unter der Bedingung, daB Miinze I ge- 
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wahlt wird, gilt dann ftir die bedingte Erwartung der Munzwurfvariablen Y [ 
unter der Magnetvariablen X! die Gleichung 

(7.3.8) £ S (Y, |x t ) = fj £a(B I Xj) p = s |3 10 + p n X, = 0.5 + 0.4-X,, 

wobei man die numerischen Werte der Koeffizienten durch Bildung der be- 
dingten Erwartungswerte £a(Yi | X[=0) = Pa(B | Xj=0) und £a(Yj | X x =l ) = 
P A (B | X t = l) und Losung der resultierenden beiden Gleichungen nach den 
zwei unbekannten Koeffizienten erhalt (siehe Abschnitt 7.2). 

Auf analoge Weise resultiert dann fur die Bedingung A die bedingte Erwartung 
£ a (Y, | XJ bezuglich des WahrscheinlichkeitsmaBes P A 

(7.3.9) £ a (Y, | X,) p = s 0.9 + 0.0878 X,. 

Damit haben wir noch einmal bestatigt, daB Y x von X x nicht einfach kausal reglinear 
abhangig ist, denn die Koeffizienten von X x aus den Gleichungen 7.3.8 und 7.3.9 sind 
nicht identisch, wie es der Definition der einfachen kausalen reglinearen Abhangigkeit 
gemaB der Fall sein muBte. Auch hier laBt sich also der Koeffizient a n =0.2439 aus 
Gleichung 

(7.3.10) E(Y t | XJ = a !0 + a„ = 0.7 + 0.2439-X, 

(siehe Abschnitt 6.3) nicht als einfacher kausaler reglinearer Effekt von X 1 auf Y a 
interpretieren. Er kann lediglich als Durchschnitt der beiden einfachen kausalen regli- 
nearen Effekte 0.4 und 0.0878 aus den Gleichungen 7.3.8 und 7.3.9 bezeichnet werden, 
denn bei Einschrankung des Geltungsbereichs unserer Aussage uber eine einfache kau- 
sale reglineare Abhangigkeit der Variablen Yj von X x auf jeweils eine der beiden Bedin- 
gungen A bzw. A, sprache wohl nichts dagegen, die durch die Gleichungen 7.3.8 und 
7.3.9 beschriebenen Abhangigkeiten kausal zu interpretieren. 

Formal wiirde man die Einschrankung des Geltungsbereichs wie folgt formu- 
lieren: Y[ ist von X[ auf dem Wahrscheinlichkeitsraum (Q,^,Pa) einfach 
kausal reglinear abhangig mit dem einfachen kausalen reglinearen Effekt 0.4, 
und auf dem Wahrscheinlichkeitsraum (Q ,r^4,P A ) mit dem Effekt 0.0878. In 
der Sprache der Experimentellen Psychologie ausgedriickt, gilt also die durch 
Gleichung 7.3.8 beschriebene einfache kausale reglineare Abhangigkeit nur ftir 
die Population der Miinze I. und die durch Gleichung 7.3.9 beschriebene nur 
ftir die Population der Miinze II. 

Offensichtlich ist auch bei der Frage nach der Populationsvaliditat lediglich 
gefragt, auf welchen Wahrscheinlichkeitsraum sich die Aussage iiber eine kau- 
sale stochastische Abhangigkeit bezieht. Der Wahrscheinlichkeitsraum repra- 
sentiert demnach sowohl die Situation als auch die Population, auf die sich eine 
Aussage uber eine stochastische Abhangigkeit bezieht. Durch eine moglichst 
genaue Beschreibung der Untersuchungssituation und der beteiligten 
Versuchspersonen, wie dies in der Experimentellen Psychologie ilblich ist, 
wird der zugrunde gelegte Wahrscheinlichkeitsraum gekennzeichnet. 
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7.4 Vergleiche der externen Validitat 



Wir gehen nun auf das im Abschnitt 6 behandelte Beispiel zurilck. Im Ab- 
schnitt 6.4 haben wir gezeigt, daf> der Koeffizient y n des einfachen logitlinea- 
ren Modells 



(7.4.1) 



£( Y.IXOf P( B|x,)f 



exp(Yio + Yu x i) 

1 + exp (Yio + Yu Xj) 



exp(0.8473 + 1.9756-XO 
“ 1 4- exp(0.8473 4- 1.9756-XO 

nicht mit dem Koeffizienten P n = 2.1972 aus Gleichung 6.2.5 identisch ist, 
mit welcher die Daten der Tabelle 6.2.1 erzeugt wurden. Wir zeigen nun, dafi 
wir den Koeffizienten p n = 2.1972 dann erhalten, wenn wir die logitlineare 
Abhangigkeit jeweils unter einer der beiden Bedingungen 

(7.4.2) A := der zweite Schalter ist aus, 

und 



(7.4.3) A := der zweite Schalter ist an. 



untersuchen, so wie wir dies auch flir die reglineare Abhangigkeit gemacht 
haben. Im Gegensatz zum reglinearen Modell wird sich aber hier zeigen, dab 
der Koeffizient |3 n = 2.1972 sowohl flir die Bedingung A als auch A gilt. 

Bezeichnen wir mit 



(7.4.4) B := {to 6 Q: Y^oo) = 1} 



weiterhin das Ereignis, daB die Miinze auf die Metallseite fallt, und legen wir 
den Wahrscheinlichkeitsraum (Q,^4,Pji) (siehe Abschnitt 7.2) zugrunde, der 
die Situationsklasse reprasentiert, in welcher der zweite Schalter aus ist, so gilt 



(7.4.5) 



£s(Y,|X.) p -,, P(B | X,) p = fs 



exp[Pio(A) + ftn X4 
1 4- exp[Pi 0 (A) + p n Xj] ' 



Zur Berechnung der beiden unbekannten Parameter bilden wir nun die be- 
dingten Wahrscheinlichkeiten" 2 ) P&(B | X^O) und Pa(B | X^l), aus denen 
wir nach einigen algebraischen Umformungen 



(7.4.6) 



Pto(A) = In 



p a (b|x,=o) 

4 - P S (B |Xj = 0)_ 



= In [0.5/(l - 0.5)] = 0.0 



22 ) Siehe zur SchreibweisedieBemerkung zur Definition A .4.1. 
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und 

(7.4.7) 



Pio(A) + p n = In 



^a(B | X t = l) 

,1 - /^(Blx^l). 



= In [0.97(1-0.9)] = 2.1972 



erhalten. Daraus ergibt sich der Koeffizient P n = 2.1972, der mit p n = 2.1972 
aus Gleichung 6.2.5 identisch ist. 

Legen wir dagegen den Wahrscheinlichkeitsraum (Q,^,.P A ) zugrunde, so fin- 
den wir auf die analoge Weise fur die Gleichung 



(7.4.8) 



Ea(Y\ | X]) = h p A (B|x,) p = fs 



exp[Pio(A) + pn Xi] 

1 + exp[P 10 (A) 4- P n Xj] ’ 



die Parameter 



(7.4.9) 

und 



Pio(A) = In 



P a (B|X 1 = 0) 

_i -p^Blx^o). 



= In [0.97(1 - 0.9)] = 2.1972 



(7.4.10) 



Pto(A) 4- P,, = In 



P A (B I X t = l) 

i - p A (B|x,=i). 



= In [0.9878/(1 - 0.9878)] = 4.3940. 



Daraus ergibt sich wieder der Koeffizient Pn = 2.1968, der bis auf Rundungs- 
fehler mit Pn = 2.1972 aus Gleichung 6.2.5 identisch ist. Dieser Koeffizient 
gilt also sowohl fiir den Wahrscheinlichkeitsraum (Q,v^,P A ) als auch f Ur 
(£2,^,P a ), d.h. er gilt sowohl unter der Bedingung A, daB der zweite Schalter 
an ist, als auch unter der Bedingung A, daB er aus ist. Hierin unterscheidet sich 
das logitlineare vom reglinearen Modell, denn die reglinearen Koeffizienten 
sind unter beiden Bedingungen verschieden, wie wir im Abschnitt 7.2 festge- 
stellt haben. Zu dem entsprechenden Ergebnis wiirden wir auch gelangen, 
wenn wir anstelle des Beispiels mit zwei verschiedenen Situationen das im 
letzten Abschnitt behandelte Beispiel mit zwei verschiedenen Populationen 
betrachten wiirden. 



Wie wir oben gezeigt haben, ist fiir das Beispiel des Abschnitt 6 die logitlineare 
Abhangigkeit der Munzwurfvariablen Y , von der Magnetvariablen X t mit dent 
Koeffizienten Pn = 2.1968 sowohl in dem Wahrscheinlichkeitsraum 

(Q,-c 4,P a ) als auch (Q ,^4,P^) giiltig, d.h. unter der Bedingung, daB der zweite 
Schalter an bzw. aus ist. Wir konnen also sagen, daB das logitlineare Modell in 
diesem speziellen Beispiel einen groBeren Geltungsbereich, oder in der Spra- 
che Campbells, eine groBere externe Validitat hat als das reglineare Modell. 
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7.5 Zusammenfassende Bemerkungen 

Es wurde anhand des im letzten Kapitel dargestellten Beispiels erlautert, wie 
sich die Frage nach deni Geltungsbereich oder der externen Validitat in der in 
diesem Beitrag vorgestellten Theorie einfacher kausaler reglinearer Abhiingig- 
keit behandeln laBt. Es wurde gezeigt. daB SOWOhl die Frage nach der Situa- 
tionsvaliditat, als auch die nach der P opu I ati on sval idi tat, die Frage nach dem 
zugrunde gelegten W ahrscheinl i ch kei tsr au m ist. 

Mit der in der Experimentellen Psychologie iiblichen genauen Beschreibung 
der Untersuchungssituationen und der herangezogenen Versuchspersonen 
wird der zugrunde gelegte Wahrscheinlichkeitsraum charakterisiert. Verallge- 
meinerungen der in einem Wahrscheinlichkeitsraum giiltigen Beziehungen auf 
einen anderen Wahrscheinlichkeitsraum konnen zwar hypothetisch vorge- 
nommen werden, aber im allgemeinen gibt es fiir solche Verallgemeinerungen 
keine logischen oder mathematischen Begriindungen. Daher muB jeweils eine 
empirische Uberpriifung vorgenommen werden. 

Es wurde gezeigt, daB in dem hier behandelten speziellen Beispiel das logitli- 
neare Modell einen groBeren Geltungsbereich oder eine groBere .externe Vali- 
ditat 1 hat, als das reglineare Modell. Damit ist gemeint, daB in der Menge der 
Wahrscheinlichkeitsraume, in denen das logitlineare Modell gilt, die Menge 
der Wahrscheinlichkeitsraume, in denen das reglineare Modell gilt, enthalten 
ist. 



8. Ausblick 

8.1 Mehrvariablenmodelle 

Die zentrale Fragestellung in diesem Beitrag war, unter welchen Vorausset- 
zungen und in welchem Sinn sich die Koeffizienten einer einfachen Regres- 
sionsgleichung kausal interpretieren lassen. Obwohl diese Frage zunachst sehr 
speziell erscheinen mag, ist sie jedoch von recht weitreichender Bedeutung fiir 
die psychologische Forschung und ihr benachbarte Disziplinen. Erstens kann 
man diese Frage namlich analog auch fiir andere Arten stochastischer Abhan- 
gigkeiten untersuchen. Zweitens laBt sich eine multiple Regressionsgleichung 

(8.1.1) E(Y | Z m , m e M) ^ a Y0 + £ ctym Z m 

meM 

in mehrere einfache Regressionsgleichungen 

(8.1.2) £ b (Y | Z m ) p = fs a Y0 (B) + a Ym Z m , meM, 

auflosen, wenn B das Ereignis bezeichnet, daB die anderen Variablen aus der 
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a, 



Z, 






a , 3 





Z 3 



Abb. 8.1.1: Pfeildiagramm eines einseitig kausalen reglinearen Modells mit drei Varia- 
blen. 

Familie (Z m , m 6 M) konstant sind. Auf diesem Sachverhall baut die Theorie 
der direkten und auch der totalen kausalen reglinearen Abhangigkeit auf, die 
ausflihrlich von Steyer (1982) behandelt wird. 

Drittens enthalten eine ganze Reihe von Modellklassen als Kern solche Regres- 
sionsgleichungen. Neben der eigentlichen Regressionsanalyse ist da an erster 
Stelle die V arianzanalyse zu nennen, bei der die Variablen Z m , m e M, die 
Zugehorigkeit zu bestimmten (z.B. experimentellen) Gruppen anzeigen. Aber 
auch die F aktoren analyse basiert, auBer auf der Annahme der bedingten sto- 
chastischen Unabhangigkeit, auf Regressionsgleichungen flir jede der beob- 
achtbaren oder manifesten Variablen Y r . r e R, unter den Faktoren oder 
latenten Variablen Z m , m 6 M. SchlieBlich kann auch ein rekursives Struktur- 
gleichungsmodell als ein System von solchen Regressionsgleichungen aufgefaBt 
werden, wobei ein Teil der Gleichungen die Beziehungen zwischen den mani- 
festen und den latenten Variablen spezifiziert und ein anderer Teil der Glei- 
chungen die Beziehungen der latenten Variablen untereinander. 

Diese Verfahren, und damit die darin enthaltenen Regressionsgleichungen, 
konnen zum einen zur Beschreibung statistischer Zusammenhange verwendet 
werden, sie konnen zum anderen aber auch Bestandteile von Theorien zur 
kausalen Erklarung statistischer Zusammenhange sein. So besteht beispiels- 




Abb. 8.1.2: Pfeilschema eines kausalen Modells mit zwei latenten Variablen (Faktoren) 
Z 3 und Z 2 , welche die stochastischen Abhangigkeiten zwischen den mani- 
festen Variablen Yi bis Y 6 erklaren. 
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weise das pfadanalytische Modell der Abbildung 8.1.1 aus den beiden Regres- 
sionsgleichungen 

(8.1.3) £(Z] | Z 2 ,Z 3 ) ^ a 10 + ci]2 Z 2 + ctj 3 Z 3 
und 

(8.1.4) £(Z 2 1 z 3 ) ^ cx 20 + a 23 Z 3 , 

das faktorenanalytische Modell der Abbildung 8.1.2 aus den sechs Glei- 
chungen 

(8.1.5) E( Y r \Zi,Z 2 ) =g (3 r o + Pri Zj + P r2 Z 2 , r e {1,...,6}, 

und das Strukturgleichungsmodell der Abbildung 8.1.3 auBer aus den Glei- 
chungen 8.1.3 bis 8.1.4 auch aus den Gleichungen 

(8.1.6) £(X S | Z 1; Z 2 ,Z 3 ) = Ys0 + Ys3 Z 3 , s e {1,2,3}, 




Abb. 8.1.3: Pfeilschema eines kausalen Modells mit drei latenten Variablen Z t . Z 2 und 
Z 3 , die zum einen die manifesten Variablen Yl bis Y 6 bzw. bis X 3 
beeinflussen, zum anderen aber auch untereinander kausal abhangig sind. 



und 

(8.1.7) £(Y r | Zj,Z 2 ,Z 3 ) ^ Pro + PrlZi + P r2 Z 2 , T 6 {1 6}. 

Liegen. wie bei den oben genannten Modellen, mehrere unabhangige Varia- 
blen vor, so kann man die Frage nach einer direkten kausalen reglinearen 
Abhangigkeit stellen, eine Frage. die flir die psychologische Theorienbildung 
genauso bedeutsam ist, wie die nach einfacher kausaler reglinearer Abhangig- 
keit. Wird beispielsweise behauptet, daB 

(8.1.8) Y := absolute IQ-Differenz von Zwillingen 
einfach kausal reglinear abhangig ist von 
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(8.1.9) 



I 1, wenn die Zwillinge eineiig, 
- 1, wenn sie zweieiig sind. 



so ist es nieht nur wichtig zu untersuchen, ob diese Aussage an sich richtig ist, 
ob es also potentielle Storvariablen W gibt, die den Regressionskoeffizienten 
Otyx der Gleichung 

(8.1.10) £(Y|X) = a Y o + a Y x X 

modifizieren, wenn eine solche Variable W konstant gehalten wird; vielmehr 
ist es auch von Bedeutung zu untersuchen, durch welche Variablen eine solche 
einfache kausale reglineare Abhangigkeit vermittelt wird. So ware es prinzi- 
piell durchaus denkbar, daB diese Abhangigkeit nur liber die zwischen X und 
Y anzuordnende Variable 



(8.1.11) Z := Ahnlichkeit des elterlichen Erziehungsverhaltens 

zustande komrnt, d.h. daB die beziiglich (X.Y.Z) direkte kausale reglineare 
Abhangigkeit der Variablen Y von X Null ware. Dies ware durchaus kein 
Widerspruch zur Aussage, daB Y von X einfach kausal reglinear abhangig ist 
(vgl. zur Diskussion dieses Beispiels Eysenck, 1979, S. 105). 

Die Grundidee direkter kausaler reglinearer Abhangigkeit einer stochastischen 
Variablen Y von einer stochastischen Variablen X - direkt beziiglich einer 
gegebenen Familie von Variablen - ist, daB eine einfache kausale reglineare 
Abhangigkeit Y von X besteht, und zwar bei Konstanz aller anderen Variablen 
in dieser Familie, die Y vorgeordnet sind, und daB der Steigungskoeffizient a YX 
iiber alle Auspragungen der konstantgehaltenen Variablen hinweg der gleiche 
bleibt. 



Diese Definition ermoglicht, daB die Koeffizienten einer multiplen Regres- 
sionsgleichung als direkte kausale reglineare Effekte interpretiert werden kon- 
nen, wenn die in der Definition genannten Bedingungen erflillt sind. Damit 
wird es nicht nur moglich. die Direktheit einer Abhangigkeit zu uberprufen, 
sondern auch potentielle Storvariablen statistisch zu kontrollieren oder ,,stati- 
stisch konstant zu halten“. 



Falsifiert ware eine Aussage, daB Y von jeder Variablen Z m , m e M, mit dent 
Effekt a Ym direkt kausal reglinear abhangig ist (siehe Gleichung 8.1.1), wenn 
fiir eine potentielle Storvariable W. gezeigt werden kann, daB die Gleichung 

(8.1.12) E { Y | W, Z m , m e M) = £ «v m Z m + f(W) 

meM 

nicht gilt, wobei f(W) eine (meBbare) Funktion von W ist. Beispielsware ware 
a Y0 + Cty^/’W eine solche Funktion von W. a Y o + CfZ m -W hingegen nicht, 
wenn a ^ 0. Dabei ist zu beachten, daB die Koeffizienten a Ym in den Glei- 
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chungen 8.1.1 und 8.1.12 identisch sind. Andernfalls ware die oben genannte 
Aussage falsifiziert. Fur eine ausfuhrlichere und vollstandigere Behandlung der 
Theorie direkter kausaler reglinearer Abhangigkeit sei auf Steyer (1982) ver- 
wiesen. 



8.2 Beschreibende und erklarende reglineare Modelle 

Bei der Beantwortung der Frage nach dem formalen Unterschied zwischen 
einem beschreibenden und einem erklarenden reglinearen Modell, und damit 
nach der Bedeutung einer kausalen Interpretation von Regressionsparametern 
sind wir von einem Wahrscheinlichkeitsraum (Q,-c4,P) ausgegangen, der in 
Anwendungsfallen eine bestimmte Untersuchungssituationsklasse oder ein be- 
stimmtes Experiment beschreibt, und zwar dadurch, daB jedem einfachen und 
verbundenen Ereignis A € ^4 eine bestimmte feste Wahrscheinlichkeit P(A) 
zugeordnet ist. Auf einem solchen Wahrscheinlichkeitsraum sind die betrach- 
teten stochastischen Variablen definiert, deren Abhangigkeiten voneinander 
moglicherweise durch Regressionsgleichungen beschreibbar sind. Bis zu die- 
sem Punkt besteht zwischen einem beschreibenden und einem erklarenden 
Modell kein Unterschied. 

Damit die durch eine einfache Regressionsgleichung 
(8.2.1) £(Y|X) ^ a Y o + Otyx X 

beschriebene stochastische Abhangigkeit zwischen der Variablen X und einer 
Variablen Y unkonfundiert ist und daher bei entsprechender zeitlicher Geord- 
netheit der Variablen kausal interpretiert werden kann. miissen zwei Bedin- 
gungen erfiillt sein, die rein formal definierbar sind. Verbal konnen diese 
Bedingungen folgendermaBen beschrieben werden: Vorgeordnetheit: Die Va- 
riable X muB der Variablen Y vorgeordnet sein. Invarianz: Der Regressions- 
koeffizient a Y x wird nicht durch potentielle Storvariablen modifiziert. Diese 
Vorstellung wurde als eine bestimmte Eigenschaft der gemeinsamen Verteilung 
der stochastischen Variablen auf dem Wahrscheinlichkeitsraum (Q ,^4l,P) pra- 
zisiert. Wie die genannten zwei Bedingungen formaler und damit genauer 
definiert sind, wie die zweite in Anwendungsfallen empirisch ilberpriift wer- 
den kann und wie empirische Untersuchungen so anzulegen sind. daB diese 
Bedingungen nach Moglichkeit erfiillt ist, wurde in diesem Beitrag fill' den Fall 
einer einzigen unabhangigen Variablen ausflihrlich beschrieben und am Ende 
der einzelnen Abschnitte jeweils zusammengefafit. Eine explizite Darstellung 
fur mehrere unabhangige Variablen findet man in Steyer (1982). Als wichtigste 
Ergebnisse konnen die folgenden Punkte hervorgehoben werden: 

1. Es wurde gezeigt, daB sich die experi mentel I en Kontrolltechni ken der Ran- 
domisierung, P aral I el i si eru n g und K on stanthal tu n g auf eine rein formale Theo- 
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rie basieren lassen. Bisher beruhten die Kontrolltechniken auf Plausibilitats- 
iiberlegungen wie etwa der folgenden, die auf Mills Unterschiedsmethode zu- 
riickgeht (Mill, 1885, S. 91 ff.): Wenn man davon ausgeht, daB ein Sachverhalt 
W von vielen anderen moglicherweise unbekannten Sachverhalten 
A,B,C,D„ . . verursacht wil'd, und man untersuchen will, ob ein bestimmter 
Sachverhalt C zu diesen Ursachen zahlt, so muB man Beobachtungen unter 
zwei Bedingungskombinationen anstellen, die sich lediglich durch C unter- 
scheiden, also A,B,C,D,. . . und A,B,C,D, .... Tritt dann nur in der ersten 
Bedingungskombination die Wirkung W auf, dann kann man davon ausgehen, 
daB C Ursache fur W ist. Der Herstellung der sonst gleichen Bedingungen 
A,B, ,D,. . . dienen die oben genannten Kontrolltechniken. 

In gewisser Hinsicht kann man die hier vorgestellte Theorie als eine Verfeine- 
rung der Millschen Theorie 23 ) ansehen, in dem Sinne, daB auch nichtdetermini- 
stische kausale Abhangigkeiten zugelassen werden. Mit dem hier behandelten 
stochastischen Begriff kausaler Abhangigkeit kann C auch dann als Ursache 
von W angesehen werden, wenn C nicht immer zusammen mit W auftritt, 
auch nicht in einer streng kontrollierten Situation, sondern nur mit erhohter 
Wahrscheinlichkeit. 

2. Es wurde gezeigt, daB Kausalitat nicht zw an gsl au fi g D eterminismus bedeu- 
tet. Beim Beispiel .Mttnzen und Elektromagnet 1 beeinflufit der Zustand des 
Elektromagneten die Ergebnisse des Miinzwerfens nur stochastisch in dem 
Sinn, daB bei angeschaltetem Elektromagneten die Wahrscheinlichkeit, daB die 
Mttnzen auf die Metallseite fallen, erhoht ist. Um die Abhangigkeit der Miinz- 
wurfergebnisse vom Zustand des Elektromagneten als kausal zu bezeichnen, 
muB diese also keineswegs deterministisch sein. Selbst wenn die Erhohung der 
Wahrscheinlichkeit nur minimal ist, z.B. von 0.5 auf 0.51, ware dies ein 
hinreichender Grund, von einer kausalen Abhangigkeit zu sprechen, deren 
praktische Bedeutsamkeit allerdings geringer ist, als wenn die Wahrscheinlich- 
keit von 0.5 auf 0.9 erhoht wird, wie in dem in Abschnitt 2 dargestellten 
Beispiel. Die Starke der Abhangigkeit und die Frage, ob die Abhangigkeit 
kausal ist, sind also zwei vollig verschiedene Fragen. 

3. Die in der Experimentellen Psychologie und Padagogik entwickelte Vor- 
stellung .interner Validitat 1 wurde zum rein formalen Begriff einfacher kausa- 
ler reglinearer Abhangigkeit prazisiert. Die formale Definition ermoglicht die 
Ableitung von Konsequenzen, die in Anwendungsfallen empirisch uberpruf- 
bar und gegebenenfalls falsifizierbar sind. Diese grundlegende Forderung an 
eine empirische wissenschaftliche Theorie ist wohl bei der bisherigen pfadana- 



23 ) Eine zusammenfassende Darstellung der Millschen Theorie findet man bei Diekopf 
(1981, S. 24ff.), der auch uber dieBeitragevon Hume, Kant, Popper u.a. zumThema 
kausale Abhangigkeit referiert. 
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lytischen Vorgehensweise nicht hinreichend erfilllt. Zwar werden Modelltests 
zur Uberpriifung der Frage durchgeftihrt, ob das statistische Modell mit der 
jeweils vorliegenden Kovarianzmatrix vertraglich ist. Die wesentliche Frage 
nach der Kausalitat der mit dem Modell beschriebenen Beziehungen wird aber 
nicht uberpriift. Die Vertraglichkeit eines Strukturgleichungsmodells mit der 
Kovarianzmatrix ist jedoch kein Hinweis daflir, daB die Strukturparameter 
kausal interpretiert werden konnen, sondern nur dafilr, daB sich die betreffen- 
den Daten mit diesem Modell beschreiben lassen. Kausalitat wird bei einem 
Strukturgleichungsmodell bisher vorausgesetzt, etwa durch die Annahme der 
,,Geschlossenheit“, aber nicht uberpriift. Auch wurde in der bisherigen Litera- 
tur nie angegeben, wie die „Geschlossenheit“ prinzipiell falsifiziert werden 
kann. 

4. Aus der hier vorgestellten Theorie lassen sich einige M ogl i chkei ten zur 
F alsifizieru ng einer Aussage ableiten. daB der Koeffizient aus der Glei- 
chung 8.2.1 kausal interpretiert werden kann. So ist z.B. jede der beiden 
folgenden Aussagen in einem Anwendungsfall hinreichend ftir eine solche 
Falsifizierung: 

a) Es besteht eine Interaktion im varianzanalytischen Sinn zwischen X und 
einer potentiellen Storvariablen W. Dabei ist es gleichgiiltig, ob diese erhoben 
wurde oder nicht. Wesentlich ist, daB sie in der betreffenden Situationsklasse 
prinzipiell erhoben werden konnte. 

b) Der Koeffizient (3yx von X in der Gleichung 

(8.2.2) £( Y | X,W) = |3 Y0 + |3 yx X + |3 YW W 

ist nicht identisch mit aus Gleichung 8.2.1, wobei W eine beliebige poten- 
tielle Storvariable ist, die in der gleichen Situationsklasse wie die anderen 
Variablen erhoben wird oder werden konnte. Bei der Erweiterung von 
E(Y | X) auf £(Y | X,W) muB also der Koeffizient unverandert bleiben, 
wenn er kausal interpretierbar sein soil. 

Die Konsequenz einer Falsifikation aufgrund von Punkt a ist eine Einschran- 
kung des Geltungsbereichs. Fur jede Auspragung der mit X interagierenden 
Variablen W gilt u.U. eine andere einfache kausale reglineare Abhangigkeit. 
Bei einer Falsifikation aufgrund von Punkt b gilt u.U. eine einfache kausale 
reglineare Abhangigkeit, wenn W = w konstant ist. 

5. Prinzipiell ist es sowohl in experimentellen als auch in nichtexperimentellen 
Untersuchungen moglich, kausale Abhangigkeiten festzustellen, aber in keiner 
Art von Untersuchung kann man beweisen, daB eine kausale Abhangigkeit 
vorliegt. Die Moglichkeit zur Falsifizierung einer Aussage fiber eine kausale 
Abhangigkeit besteht jedoch in beiden Forschungssituationen. Diese unter- 
scheiden sich nur darin, in welchem AusmaB es moglich ist, durch versuchs- 
planerische MaBnahmen potentielle Storvariablen zu kontrollieren. Je geringer 
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die Moglichkeiten der aktiven Kontrolle potentieller Storvariablen sind, desto 
wichtiger wird es, potentielle Storvariablen mitzuerheben und diese entweder 
mit in das Modell einzubeziehen, Oder die unter Punkt 4 genannten .Kausali- 
tatstests' durchzufuhren. 



Weiterfuhrende Literatur 

Die Verallgemeinerung der hier dargestellten Theorie einfacher kausaler reglinearer 
Abhangigkeitauf Mehrvariablenmodellefindet man bei Steyer (1982). Eineweitere 
Verallgemeinerung auf nichtrekursive Modelle, in denen auch wechselseitige Abhangig- 
keiten vorkommen konnen, ist in Vorbereitung. Eine Ubersicht uber Stichprobenpro- 
bleme wie Parameterschatzung und Hypothesen- bzw. Modellbewertungsverfahren 
insbesondere fur komplexe Modelle gibt Bentler (1980), der auch verschiedene Rechen- 
programme fur diese Zwecke angibt. Fur die einfacheren Varianz- und regressionsana- 
lytischen Modelle siehe auch die entsprechenden Beitrage in diesem Band. Ein uber- 
blick uber verschiedene Schatzverfahren gibt Klein (1978). Zur Einfuhrung in pfadana- 
lytische Modelle sei auch auf Asher (1976) und Kenny (1979) hingewiesen. Als weiter- 
fuhrende Arbeiten und Anwendungen seien Aigner und Goldberger (1977), Anderson 
und Evans (1974), Blalock (1962, 1964, 1969, 1971a, b), Blalock und Blalock (1968), 
Boudon (1963, 1965a, b, 1968, 1976a, b), Hummell und Ziegler (1976a) sowie Marsden 
(1982) genannt. 



Anhang 

A.l Einleitende Bemerkungen 

In diesem Anhang sind einige im Text haufig verwendete Definitionen und Theoreme 
der Wahrscheinlichkeitstheorie zusammengestellt. Damit soil lediglich die Angabe der 
mathematischen Grundlagen bei Ableitungen und Beweisen vereinfacht werden. Mit 
diesem Anhang ist weder ein Anspruch auf V oil stand igkeit verbunden, noch ist inten- 
diert, den Leser in die Wahrscheinlichkeitstheorieeinzufuhren. Dazu sei auf Bauer 
(1974), Breiman (1968), Ganssler und Stute (1977), Hinderer (1980) sowie Loeve (1977, 
1978) verwiesen. Zum Nachschlagen eignet sich Muller (1975). 



A. 2 Erwartungswert 

Definition A. 2.1. Essei X:Q-*IR eine stochastische Variable 24 ) auf dem Wahrschein- 
lichkeitsraum(Q,^,P).AuBerdemsei X bezuglich P integrierbar Oder nichtnegativ. 
Genau dann, wenn 



24 ) IR istdabei dieMengeder reellen Zahlen. Wir betrachten in diesem Beitrag nur 
reellwertige stochastische Variablen. Viele Autoren gebrauchen anstelle der Bezeich- 
nung .stochastische Variable' die Bezeichnung ,Zufallsvariable'. 
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(A. 2.1) £(X) := J X dP, 

heiKt E(X) der Erwartungswert von X (bezuglich des WahrscheinlichkeitsmaSes P). 

Theorem A. 2.1. 1st X eine diskrete stochastische Variable auf dem Wahrscheinlich- 
keitsraum (Q,*A,P) mit dem Erwartungswert E(X) und den Werten x ; , i e I, wobei I 
eine abzahlbare Indexmenge ist, und bezeichnet 

(A. 2.2) A; := {to e Q: X(w) = x ; } 

das Ereignis, daS X den Wert x, angenommen hat, dann gilt 

(A. 2.3) E(X) = Y. x i AA) 

iel 

(vgl. z.B. Bauer, 1974, S. 138f.). 

Theorem A. 2. 2. Sind X und Y stochastische Variablen auf dem Wahrscheinlichkeits- 
raum (Q ,^4,P) mit den Erwartungswerten E(X) bzw. E(Y) und sind a und B reelle 
Zahlen, so gelten 

(A. 2.4) £(a) = a und £(a X + |3 Y) = a £(X) + p £(Y) 

(vgl. z.B. Bauer, 1974, S. 65). 



A. 3 Varianz und Kovarianz 

Definition A .3.1. Es seien X und Y stochastische Variablen auf dem Wahrscheinlich- 
keitsraum (Q,*4,P) mit den Erwartungswerten E(X) bzw. E(Y). Genau dann, wenn 

(A. 3.1) C(X,Y) := £([X - £(X)] ■ [Y - £(Y)]), 

heiBt C(X,Y) Kovarianz von X und Y. Genau dann, wenn 

(A. 3.2) V(X) := C(X,X) = £([X - £(X)] 2 ), 

heiSt V (X ) Varianz von X (vgl. z.B. Ganssler & Stute, 1977, S. 8lf.). 

Theorem A .3.1. Sind X und Y stochastische Variablen auf dem Wahrscheinlichkeits- 
raum (Q,^4,P) mit den Erwartungswerten E(X) bzw. E(Y), so gilt 25 ) 

(A. 3.3) C(X,Y) = £(X-Y) - £(X) - £(Y) 

und, falls a und S reelle Zahlen sind, auch 

(A. 3.4) C(aX,PY) = a C(X,Y) p. 
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Theorem A .3.2. Sind W, X, Y und Z stochastische Variablen auf dem Wahrscheinlich- 
keitsraum(Q,^,P), mitden Erwartungswerten E(W), E(X), E(Y) bzw. E(Z) und sind 
a, p, y und 5 reelleZahlen, so gilt 25 ) 

(A. 3.5) C[(aW + pX),(yY + 8Z)] = 

= a C(W,Y) v + a C( W,Z) 6 + p C(X,Y) y + p C(X,Z) 8. 



A. 4 Bedingter Erwartungswert 

Definition A.4.1. Es sei Y eine stochastische Variable auf dem Wahrscheinlichkeits- 
raum (Q B e & ein Ereignis mit P(B) > 0, und ^ sei die I nd i katorvari abl e 26 ) von 

B. Genau dann, wenn 

(A.4.1) £( Y|B):= -±-E(1 b -Y), 

i J (B) 

heiBt £(Y | B) bedingter Erwartungswert von Y gegeben das Ereignis B. Genau dann, 
wenn Y dabei nur die Werte 0 und 1 annehmen kann, und 

(A. 4.2) A := (to e £2: Y(co) = 1} 

das Ereignis ist, daB Y den Wert 1 angenommen hat, heiBt 

(A .4.3) /’(A | B) := E( Y | B) = P(ADB)/P(B) 

die bedingte W ahrscheinl ichkeit von A gegeben das Ereignis B (vgl. z.B. Bauer, 1974, 
s. 290ff.). 

Bemerkung. Mit E( Y | B) und P(A | B) aquivalente Schreibweisen sind E,(Y) bzw. 
P,(A). Mit dieser Notation wird hervorgehoben, daK £ B ( Y) der Erwartungswert von Y 
bezuglich des bedingten WahrscheinlichkeitsmaBes P B bzw. daK Ps(A) der Wert des 
bedingten WahrscheinlichkeitsmaBes P B fur das Ereignis A ist. Das MaB P B ist durch 
Gleichung A.4.3definiert, diedabei auf jedesA e& anzuwenden ist. 

Theorem A.4.1. Es seien X und Y stochastische Variablen auf dem Wahrscheinlich- 
keitsraum (Q,*J,P) mit den Erwartungswerten £(X) bzw. £(Y)sowiea und B reelle 
Zahlen. Wenn £(Y | B) der bedingte Erwartungswert von Y gegeben das Ereignis B e 
ist, dann gelten die folgenden Gleichungen 27 ): 



25 ) Die in Theorem A.3.1 und A.3.2 behaupteten Eigenschaften folgen aus der Defi- 
nition A. 3.1 und Theorem A. 2.2. 

26 ) Die stochastische Variable le auf dem Wahrscheinlichkeitsraum {Q.,^A,P) heiBt In- 
dikatorvariable fur das Ereignis Be & genau dann, wenn l B (co) = 1, falls w e B und i b (m) 
= 0 andernfalls. 

27 ) Die in Theorem A.4.1 behaupteten Eigenschaften folgen direkt aus da Definition A.4.1 
und Theorem A.3.1. 
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(A. 4.4) 


£(Y | Q) = £(Y), 




(A. 4.5) 


E(a | B) = a, 




(A. 4.6) 


£(a X + |3 Y | B) = a £(X | B) + |3 £(Y | B). 





A. 5 Bedingte Erwartung 

Definition A. 5. 2. Es sei Y eine stochastische Variable auf dem Wahrscheinlichkeits- 
raum (Q mit Erwartungswert E(Y), 35 sei eine Teilsigmaalgebra von ^4, d.h. 35 c 
^4, und l B sei die Indikatorvariablefur BeB. Genau dann, wenn 

(A. 5.1) £[1 B '£(Y|)5)] = £(1 b -Y), fur alle B e 35, 

und £(Y 1 7?) meBbar bezuglich 75 ist, heiBt E(Y | B) bedingte Erwartung von Y unter 
der Sigmaalgebra B (vgl. z.B. Ganssler & Stute, 1977, S. 187). 

Genau dann, wenn Y = l A , heiBt E(Y 1 75) bedingte W ahrscheinl ichkeit von A unter der 
Sigmaalgebra 35 und wird dann auch mit £(A| 5) notiert (vgl. z.B. Bauer, 1974, 
S. 296) 28 ). 

Bemerkungen. Durch diese Definition ist die bedingte Erwartung £(Y |75) nur fast 
sicher eindeutig bestimmt. Man spricht daher auch von verschiedenen Versionen der 
bedingten Erwartung, die jedoch fast sicher gleich sind, was wir mit dem Zeichen ,= ‘ 
abkurzen. Aussagen uber bedingte Erwartungen gelten daher im allgemeinen nur fast 
sicher. Ist die bedingte Erwartung bezuglich eines anderen WahrscheinlichkeitsmaBes 
als P gemeint, z.B. bezuglich P A , dann schreiben wir entsprechend £ A (Y 1 75). Aussagen 
uber eine solche bedingte Erwartung gelten entsprechend nur P A -fast sicher, und ver- 
schiedene Versionen sind P A -fast sicher gleich, was wir durch , T = + ‘ abkurzen. Ist die 
Sigmaalgebra B von einer stochastischen Variablen X auf (Q,^i,') 5 ) erzeugt, so schrei- 
ben wir anstatt£(Y|z?) auch £(Y|X). Ist B von einer Familie(X i ,ieI) von stochasti- 
schen Variablen erzeugt, so notieren wir die bedingte Erwartung £(Y|)5) auch mit 
E (Y | Xj,iel). Ist die Indexmenge I abzahlbar, d.h. ist I = (1,...,Q>, Q e IN, so 
schreiben wir auch £(Y| X 1 ,...,X q ) (vgl. auch Bauer, 1974, S. 292). 

Theorem A. 5.1. Wenn E(Y | B) die bedingte Erwartung der stochastischen Variablen Y 
auf dem Wahrscheinlichkeitsraum (Q,^4,P) unter der Sigmaalgebra B ist, dann gelten 
die folgenden Aussagen: 

(A. 5.2) £[£(Y I B) | B] = £(Y | B), fur alle B 6 B, mit £(B) > 0, 

(A. 5.3) £[£(Y | 75)] = £(Y), 



28 ) Man beachte den Unterschied zwischen der bedingten Wahrscheinl ichkeit P(A | B) 
von A gegeben das E reignis B und der bedingten Wahrscheinl ichkeit P(A 1 75) von A 
unter der Sigmaalgebra 75. 
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(A. 5.4) £[Y - £(Y | 75)] = 0, 

(A. 5.5) £(Y|75) = Y, falls Y mefibar beziiglich 75 ist, 

(A. 5.6) £(Y | B) = £(X | B), falls X = Y 

(vgl. z.B. Bauer, 1974, S. 293) 

Theorem A. 5.2. Wenn £(y|b) die bedingte Erwartung der stochastischen Variablen Y 
auf dem Wahrscheinlichkeitsraum (Q,^4,P) unter der Sigmaalgebra 75 ist, und C ist ein 
Teilsigmaalgebra von75,d.h.C c: 75, dann gelten folgende Aussagen: 

(A. 5.7) £[£(Y | 75) | C] = £[£( Y | C) | B] = £(Y | C), 

und 

(A. 5.8) £[Y - £(Y|B)|C] = 0 

(vgl. z.B. Bauer, 1974, S. 293). 

Theorem A .5.3. Wenn X und Y stochastische Variablen auf dem Wahrscheinlichkeits- 
raum (Q,^4,P) sind mitden Erwartungswerten E (X ) bzw. E(Y) sowieaund 15 reelle 
Zahlen, dann gelten die folgenden Aussagen: 

(A. 5.9) £(ot | 75) = a, 

(A. 5.10) £(cxX + |3Y | 75) = a £(X | 75) + (3 £(Y | 75), 

(A. 5.11) £(X-Y 1 75) = X £(Y| 75), falls X bezuglich 75 mel5bar ist 

(vgl. z.B. Bauer, 1974, S. 293). 

Bemerkung. X ist z.B. dann bezuglich 75 meBbar, wenn 75 die von (X q ,qeQ) erzeugte 
Sigmaalgebra ist, und X = Xq, fur ein q e Q. 

Theorem A. 5.4. Wenn X eine bezuglich 75 meBbare stochastische Variable auf dem 
Wahrscheinlichkeitsraum (Q ,«#,£) ist, und es gilt fur die bedingte Erwartung E(Y 1 75) 
von Y unter 75 

(A.5.12) £(Y | B) = £(Y), 

dann folgt 

(A. 5.13) C(X,Y) = 0. 

Beweis. Nach Theorem A. 3.1 gilt 

(A. 5.14) C(X,Y) = £(X-Y) - £(X) £(Y). 

Wenn wir Gleichung A. 5.3 auf X-Y anwenden, erhalten wir daraus 
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(A. 5. 15) C(X,Y) = £[£(X-Y | 75)] - £(X) • £(Y). 

Nach Gleichung A. 5.11 folgt dann 

(A. 5. 16) C(X,Y) = £[X • £(Y | 75)] - £(X) • £(Y), 

und nach Gleichung A. 5.12 und A. 2.4 

(A. 5. 17) C(X,Y) = £(X) • £(Y) - £(X) ■ £(Y). 

Theorem A. 5. 5. Es seien X und Y stochastische Variablen auf dem Wahrscheinlich- 
keitsraum (Q und £(Y) sei der Erwartungswert von Y. Wenn X und Y stocha- 
stisch unabhangig sind, dann gilt 

(A. 5. 18) £(Y | X) = £(Y) 

(vgl. Breiman, 1968, S. 74). 



Literatur 



Ahrens, H. 1968. Varianzanalyse. Berlin: Akademie-Verlag. 

Aigner, D. J. & Goldberger, A. S. (Hrsg.). 1977. Latent variables in socio-economic 
models. Amsterdam: North-Holi and. 

Anderson, J. G. & Evans, F. B. 1974. Causal models in educational research: Recursive 
models. American Educational Research Journal, 11, 29-39. 

Anderson, T. W. 1954. On estimation of parameters in latent structure analysis. 
Psychometrika, 19, 1-10. 

Anderson, T. W. 1958. An introduction to mutlivariate statistical analysis. New York: 
Wiley. 

Anderson, T. W. 1959. Some scaling models and estimation procedures in the latent 
class model. In: Grenander, O. Probability and statistics. The Harold Cramer 
Volume. New York: Wiley, 9-38. 

Anderson, T. W. & Rubin, H. 1956. Statistical inference in factor analysis. Proceedings 
of the Third Berkeley Symposium on Mathematical Statistics and Probability, 5, 
111-150. 

Asher, H. B. 1976. Causal modeling. Beverly Hills: Sage. 

Bagozzi, R. P. 1980. Causal models in marketing. New York: Wiley. 

Bartenwerfer, H. & Raatz, U. 1979. Methoden der Psychologie. Wiesbaden: 
Akademische Verlagsgesellschaft. 

Bauer, H. 1974. Wahrscheinlichkeitstheorieund Grundzugeder MaBtheorie. Berlin: 
de Gruyter. 




146 



Rolf Steyer 



Bentler, P. M. 1980. Multivariate analysis with latent variables: Causal modeling. 
Annual Review of Psychology, 31, 419-456. 

Bishop, Y. Y. M„ Fienberg, S. E. & Holland, P. W. 1975. Discrete multivariate 
analysis: Theory and Practice. Cambridge: MIT Press. 

Blalock, H. M. Jr. 1962. Further observations on asymmetric causal models. American 
Sociological Review, 27, 542-545. 

Blalock, H. M. Jr. 1964. Causal inferences in nonexperi mental research. Chapel Hill: 
University of North Carolina Press. 

Blalock, H . M . Jr. 1969. Theory construction. From verbal to mathematical formula- 
tions. Englewood-Cliffs, N.J.: Prentice-Hall. 

Blalock, H. M. Jr. 1971a. (Hrsg.). Causal models in the social sciences. Chicago: 
Aldine-Atherton. 

Blalock, H. M.Jr. 1971b. Four variable causal models and partial correlations. In: 
Blalock, H. M. Jr. 1971a, 18-32. 

Blalock, H. M.Jr. & Blalock, A. B. (Hrsg.). 1968. Methodology in social research. 
New York: McGraw-Hill. 

Bock, R. D. 1975. Multivariate statistical methods in behavioral research. New York: 
McGraw-Hill. 

Boudon, R. 1963. Proprietes individuelles et proprietes collectives: Un probleme 
d'analyseecologique. Revue francaisedesociologie, 4, 275-299. 

Boudon, R. 1965a. A method of linear causal analysis: Dependence analysis. American 
Sociological Review, 30, 365-374. 

Boudon, R. 1965b. Methodes d'analyse causale. Revue francaise de sociologie, 6, 
24-43. 

Boudon, R. 1968. A new look at correlation analysis. In: Blalock, H . M . & Blalock, A. 
B. 1968, 199-235. 

Boudon, R. 1976a. Neue Aspekte der Korrelationsanalyse. In: Hummell, H.J. & 
Ziegler, R. Korrelation und Kausalitat, Bd. 2, 205-235. 

Boudon, R. 1976b. Anwendungen der Dependenzanalyseauf Paneldaten. In: Hum- 
mell, H.J. & Ziegler, R. Korrelation und Kausalitat, Bd. 3, 421-434. 

Bortz, J. 1977. Lehrbuch der Statistik. Fur Sozialwissenschaftler. Berlin: Springer. 

Brandstadter, J. & Bernitzke, F. 1976. ZurTechnikder Pfadanalyse. Ein Beitrag zum 
Problem der nichtexperimentellen Konstruktion von Kausalmodellen. 
Psychologische Beitrage, 18, 12-34. 

Bredenkamp, J. 1969. Experiment und Feldexperiment. In: Graumann, C. F. Hand- 
buch der Psychologie: Sozialpsychologie, Bd. 7, 1. Halbband, Theorien und 
Methoden. Gottingen: Hogrefe, 332-374. 

Bredenkamp, J. 1979. Das Problem der externen Validitat padagogisch-psycho- 
logischer Untersuch ungen. In: Brandtstadter, J ., Reinert, G. & Schneewind, K. 
A. Padagogische Psychologie: Probleme und Perspektiven. Stuttgart: Klett. 




Modelle zur kausalen Erklarung statistischer Zusammenhange 



147 



Bredenkamp, J. 1980. Theorie und Planung psychologischer Experimente. Darmstadt: 
Steinkopff. 

Breiman, L. 1968. Probability. Reading, Mass.: Addison-Wesley. 

Brunswik, E. 1956. Perception and the representative design of psychological experi- 
ments. Barkeley: University of California Press. 

Bunge, M . 1967. Scientific research I. The search for system. Berlin: Springer. 

Campbell, D. T. 1957. Factors relevant to the validity of experiments in social settings. 
Psychological Bulletin, 54, 297-312. 

Campbell, D.T. & Stanley, J. C. 1963. Experimental and quasi-experi mental designs 
for research on teaching. In: Gage, N. L. Handbook of research in teaching. 
Chicago: Rand-McNally, 171-246. 

Coleman, J. S. 1981. Longitudinal data analysis. New York: Basic Books. 

Cook, T. D. & Campbell, D.T. 1976. The design and conduct of quasi-experi ments 
and true experiments in field settings. In: Dunette, M. D. Handbook of industrial 
and organizational psychology. Chicago: Rand-McNally, 223-326. 

Cook, T. D. & Campbell, D. T. 1979. Quasi-experimentation: Design & analysis 
issues for field settings. Chicago: Rand-McNally. 

Cox, D. R. 1970. The analysis of binary data. London: Methuen. 

Diekopf, B. A. 1981. Die kausale Interpretierbarkeit psychologischer Aussagen. 
Frankfurt: Institut fur Psychologie der JWG-Universitat. Unveroffentlichtes 
Manuskript. 

Duncan, O. D. 1975. Introduction to structural equation models. New York: 
Academic Press. 

Essler, W. K. 1979. Wissenschaftstheorie IV. Erklarung und Kausalitat. Munchen: 
Alber. 

Eysenck, H. J. 1979. The structure and measurement of intelligence. Berlin: Springer. 

Fischer, G. H. 1974. Einfuhrung in dieTheorie psychologischer Tests. Bern: Huber. 

Fisher, F. M . 1966. The identification problem in econometrics. New York: McGraw- 
Hill. 

Fisher, F. M. 1978. Statistical identifi abi I ity. In: Kruskal, W. H. & Tanur, J. M. 
International encyclopedia of statistics. New York: The Free Press, Vol. II, 
1066-1071. 

Fisher, R. A. 1925. Statistical methods for research workers. London: Oliver and 
Boyd. 

Fisher, R. A. 1947. The design of experiments. London: Oliver and Boyd. 

Fisher, R. A. 1956. Statistische Methoden fur die Wissenschaft. London: Oliver and 
Boyd. 

Formann, A. K. 1980. Neuere Verfahren der Parameterschatzung in der Latent-Class- 
Analyse. Zeitschrift fur Differentielle und Diagnostische Psychologie, 1, 
107-116. 




148 



Rolf Steyer 



Gadenne, V. 1976. DieGultigkeit psychologischer Untersuchungen. Stuttgart: Kohl- 
hammer. 

Gaensslen, H. & Schubo, W. 1973. Einfache und komplexe statistische Analyse. Eine 
Darstellung der multivariaten Verfahren fur Sozialwissenschaftler und Mediziner. 
Munchen: Reinhardt. 

Ganssler, P. & Stute, W. 1977. Wahrscheinlichkeitstheorie. Berlin: Springer. 

Gibson, W. A. 1959. Three multivariate models: Factor analysis, latent structure analy- 
sis, and latent profile analysis. Psychometrika, 27, 73-81. 

Gibson, W. A. 1962. Latent structure and positive manifold. British Journal of Statisti- 
cal Psychology, 15, 149-160. 

Goldberger, A. S. 1964. Econometric theory. New York: Wiley. 

Goldberger, A. S. 1973. Structural equation models: An overview. In: Goldberger, 
A. S. & Duncan, O. D„ 1-18. 

Goldberger, A. S. & Duncan, O. D. 1973. (Hrsg.). Structural equation models in the 
social sciences. New York: Seminar Press. 

Goodman, L. A. 1974. Exploratory latent structure analysis using both identifiable and 
unidentifiable models. Biometrika, 61, 215-231. 

Goodman, L. A. 1978. Analyzing qualitative categorical data. Log-linear models and 
latent-structure analysis. London: Addison-Wesley. 

Goodman, L. A. 1979. A note on the estimation of parameters in latent-structure 
analysis. Psychometrika, 44, 123-128. 

Granger, C. W. J. 1969. Investigating causal relations by econometric models and 
Cross-spectral methods. Econometrica, 37, 424-438. 

Granger, C. W. J. 1973. Causality, model building, and control: Some comments 
presented at the IFAC/ FORS International Conference on Dynamit Modeling 
and Control, July 9-12 (University of Warwiek, Coventry). 

Green, B. F. 1951. A general solution for the latent class model of latent structure 
analysis. Psychometrika, 16, 151-166. 

Green, B. F. 1952. Latent structure analysis and its relation to factor analysis. Journal 
of the American Statistical Association, 47, 71-76. 

Hager, W. & Westermann, R. Planung und Auswertung von Experimenten. In: Bre- 
denkamp,J. & Feger, H. Enzyklopadieder Psychologie. Forschungsmethoden 
der Psychologie. Bd. 5. Gottingen: Hogrefe(im Druck). 

Harnerle, A. 1982. Latent-Trait-Model le. Weinheim: Beltz. 

Heider, F. 1958. The psychology of interpersonal relations. New York: Wiley. 

Heise, D. R. 1975. Causal analysis. New York: Wiley. 

Henning, H.J. & Muthig, K. 1979. Grundlagen konstruktiver Versuchsplanung: Ein 
Lehrbuch fur Psychologen. Munchen: Kosel. 

Herkner, W. H. 1980. (Hrsg.). Attribution - Psychologie der Kausalitat. Bern: 
Huber. 




Modelle zur kausalen Erklarung statistischer Zusammenhange 



149 



Herrmann, T. 1969. Lehrbuch der empirischen Personlichkeitsforschung. Gottingen: 
H ogrefe. 

Hinderer, K. 1980. Grundbegriffe der Wahrscheinlichkeitstheorie. Berlin: Springer. 

Hodapp, V. 1978. Causal inference from nonexperi mental research on anxiety and 
educational achievement. I n: Krone, H . H . & Laux, L. Achievement, Stress, and 
Anxiety. Washington, D.C.: Hemisphere. 

Hosoya, Y. 1977. On the Granger condition for non-causality. Econometrica, 45, 
1735 - 1736 . 

Hummell, H. J. & Ziegler, R. 1976a. (Hrsg.). Korrelation und Kausalitat. Bd. 1, 2 und 
3. Stuttgart: Enke. 

Hummell, H. J. & Ziegler, R. 1976b. Zur Verwendung linearer Modelle bei der 
Kausalanalyse nicht-experimenteller Daten. In: Hummell, H.J. & Ziegler, R. 
Bd. 1, E 5-E 137. 

Joreskog, K. G. 1969. A general approach to confirmatory maximum likelihood factor 
analysis. Psychometrika, 34, 183-202. 

Joreskog, K. G. 1970, A general method for analysis of covariance structures. Biome- 
trika, 57, 239-251. 

Joreskog, K. G. 1971. Statistical analysis of sets of congeneric tests. Psychometrika, 36, 
109-133. 

Joreskog, K. G. 1973. A general method for estimating a linear structural equation 
system. In: Goldberger, A. S. & Duncan, O. D„ 85-112. 

Joreskog, K. G. 1974. Analyzing psychological data by structural analysis of 
covariance matrices. In: Krantz, D. H„ Atkinson, R. C„ Luce, R. D. & Suppes, 
P. Contemporary developments in mathematical psychology. Vol. II. San Fran- 
cisco: Freeman and Company, 1-56. 

Joreskog, K. G. 1977. Structural equation models in the social sciences. Specification, 
estimation, and testing. In: Krishnaiah, P. R. Applications of statistics. Amster- 
dam: North-Holland, 265-287. 

Joreskog, K. G. 1978. Structural analysis of covariance and correlation matrices. 
Psychometrika, 43, 443-477. 

Joreskog, K. G. 1979. Statistical estimation of structural models in longitudinal de- 
velopmental investigations. In: Nesselroade, J. R. & Baltes, P. B. Longitudinal 
research in the study of behavior and development. New York: Academic Press. 

Joreskog, K. G. & Sorbom, D. 1976. Statistical models and methods for test-retest 
situations. In: de Gruijter, D. N. M. & van der Kamp, L. J. T. Advances in 
psychological and educational measurement. New York: Wiley, 285-325. 

Joreskog, K. G. & Sorbom, D. 1977. Statistical models and methods for the analysis of 
longitudinal data. In: Aigner, D. J. & Goldberger, A. S„ 235-285. 

Joreskog, K. G. & Sorbom, D. 1979. Advances in factor analysis and structural equa- 
tion models. Cambridge, Mass.: Abt Books. 

Joreskog, K. G. & Sorbom, D. 1981. LISREL V. Analysis of linear structural relation- 




150 



Rolf Steyer 



ships by maximum likelihood and least squares methods. University of Uppsala. 
Department of Statistics. 

Johnston, J. 1971. Econometric methods. Tokyo: McGraw-Hill Kogakusha. 

Jones, E. E„ Kanouse, D. E„ Kelley, H. H„ Nisbett, R. E., Valins, S. & Weiner, B.: 
1971/72. Attribution: Perceiving the causes of behavior. Morristown, N. J.: Gen- 
eral Learning Press. 

Kenny, D. A. 1979. Correlation and causality. New York: Wiley. 

Klein, L. R. 1978. Simultaneous equation estimation. In: Kruskal, W. H. &Tanur, J. 
M ., 979-994. 

Kraak, B. 1966. Zum Problem der Kausalitat in der Psychologie. Psychol ogische Bei- 
trage, 9, 413-432. 

Krishnaiah, P. R. 1980. (Hrsg.). Handbook of statistics 1. Analysis of variance. Am- 
sterdam: North-Holi and. 

Kruskal, W. H . & Tanur, J. M . (Hrsg.). 1978. International encyclopedia of statistics. 
Vol. I and II. New York: The Free Press. 

Lawley, D. N. & Maxwell, A. E. 1971. Factor analysis as a statistical method. London: 
Butterworths. 

Lazarsfeld, P. F. 1955. Interpretation of statistical relations as a research Operation. In: 
Lazarsfeld, P. F. & Rosenberg, M . The language of social research. New York: 
The Free Press, 115-125. 

Lazarsfeld, P. F. 1959. Latent structure analysis. In: Koch, S. Psychology: A study of a 
science. Vol. Ill, New York: McGraw-Hill, 476-535. 

Lazarsfeld, P. F. & Henry, N. W. 1968. Latent structure analysis. Boston: Houghton 
Mifflin. 

Loeve, M. 1977. 1978. Probability theory. Vol. I und II. Berlin: Springer. 

Lohmoller, J. B. 1981. LVPLS 1.6 program manual. Latent variables path analysis with 
partial least-squares estimation. Forschungsbericht 81.04 des Fachbereichs 
Padagogik der Hochschule der Bundeswehr Munchen. 

Lord, F. M . & Novick, M . R. 1968. Statistical theories of mental test scores. Reading, 
Mass.: Addison-Wesley. 

Lumsden, J. 1976. Test theory. Annual Review of Psychology, 27, 251-280. 

Malinvaud, E. 1970. Statistical methods of econometrics. Amsterdam: North-Hoi I and. 

Marsden, P. V. 1982. Linear models in social research. London: Sage. 

McDonald, R. P. 1962. A general approach to nonlinear factor analysis. Psychometri- 
ka, 27, 397-415. 

McDonald, R. P. 1967a. Nonlinear factor analysis. Psychometric Monograph, 15. 
Chicago: U ni versity of Chicago Press. 

McDonald, R. P. 1967b. Numerical methods for polynomial models in nonlinear 
factor analysis. Psychometri ka, 32, 77-112. 

McGuigan, E.J. 1978. Experimental psychology. Englewood Cliffs: Prentice- Hall. 




Modelle zur kausalen Erklarung statistischer Zusammenhange 



151 



Mill, J. S. 1885. System der deduktiven und induktiven Logik. Gesammelte Werke, Bd. 
II. Leipzig: Fues. 

Moosbrugger, H. 1978. Multivariate statistische Analyseverfahren. Stuttgart: Kohl- 
hammer. 

Muller, P. H. 1975. (Hrsg.). Lexikon der Stochastik. Berlin: Akademie-Verlag. 

Namboodiri, N. K„ Carter, L. F. & Blalock, H. M. Jr. 1975. Applied multivariate 
analysis and experimental designs. New York: McGraw-Hill. 

Pierce, D. A. & Haugh, L. D. 1977. Causality in temporal systems: Characterizations 
and a survey. Journal of Econometrics, 5, 265-293. 

Popper, K. R. 1959. The propensity interpretation of probability. The British Journal 
for the Philosophy of Science, 10, 25-42. 

Popper, K. R. 1969. Logik der Forschung. Tubingen: Mohr 1969. 

Preiser, S. 1977. Dieexperimentelle Methode. In: Strube, G. Die Psychologiedes 20. 
Jahrhunderts. Band V, 102-150. 

Rao, C. R. 1973. Linear statistical inference and its applications. New York: Wiley. 

Rasch, G. 1960. Probabilistic models for some intelligence and attainment tests. 
Kopenhagen: The Danish Institute for Educational Research. 

Rasch, D. 1976. Einfuhrung in die mathematische Statistik. II. Anwendungen. Berlin: 
Deutscher Verlag der Wissenschaften. 

Rasch, D. 1978. Einfuhrung in die mathematische Statistik. I. Wahrscheinlichkeits- 
rechnung und Grundlagen der mathematischen Statistik. Berlin: Deutscher Verlag 
der Wissenschaften. 

Rosenthal, R. 1964. The effect of the experimenter on the results of psychological 
research. In: Maher, B. A. Progress in experimental personality research. Vol. I. 
New York: Academic Press, 79-114. 

Rosenthal, R. 1966. Experimenter effects in behavioral research. New York: Appleton- 
Century-Crofts. 

Sards, V. 1968. Zum Problem der Kausalitat in der Psychologie: Ein Diskussionsbei- 
trag. Psycho I ogische Beitrage, 10, 173-186. 

Schach, S. & Schafer, T. 1978. Regressions- und Varianzanalyse. Eine Einfuhrung. 
Berlin: Springer. 

Scheffe, H . 1959. The analysis of variance. New York: Wiley. 

Schulz, T., Muthig, K.-P. & Koeppler, K. 1981. Theorie, Experiment und Versuchs- 
planung in der Psychologie. Stuttgart: Kohlhammer. 

Searle, S. R. 1971. Linear Models. New York: Wiley. 

Seibel, H. D. & Nygreen, G. T. 1972. Pfadanalyse. Ein statistisches Verfahren zur 
Untersuchung linearer Kausal modelle. Zeitschrift fur Sozial psychologie, 3, 5-12. 

Selg, H. & Bauer, W. 1976. Forschungsmethoden der Psychologie. Stuttgart: Kohl- 
hammer. 




152 



Rolf Steyer 



Simon, H . A. 1952. On the definition of the causal relation. Thejournal of Philoso- 
phy, 49, 517-528. 

Simon, H. A. 1953. Causal ordering and identifiabi I ity. In: Hood, W. C. & Koop- 
mans, T. C., 49-74. 

Simon, H. A. 1954. Spurious correlation: A causal interpretation. Journal of the 
American Statistical Association, 49, 467-479. 

Spearman, C. 1904. General intelligence objectively determined and measured. Ameri- 
can Journal of Psychology, 15, 201 - 293 . 

Spearman, C. 1927. The abilities of man. London: Macmillan. 

Stegmuller, W. 1969. Probleme und Resultate der Wissenschaftstheorie und Analyti- 
schen Philosophie. Bd. I. Wissenschaftliche Erklarung und Begrundung. Berlin: 
Springer. 

Stegmuller, W. 1973. Probleme und Resultate der Wissenschaftstheorie und Analyti- 
schen Philosophie. Bd. IV. Personelle und statistische Wahrscheinlichkeit. Berlin: 
Springer. 

Steyer, R. 1982. Ein Beitrag zur theoretischen Grundlegung experimental I er und nicht- 
experimenteller Kausalforschung. Frankfurt/ M.: Dissertation am Fachbereich 
Psychol ogie der Johann Wolfgang Goethe-U niversitat. 

Sullwold, F. 1977. Intelligenzdiagnostik und Intelligenztheorie. In: Strube, G. Die 
Psychol ogi e des 20. Jahrhunderts. Band V, 236-286. 

Suppes, P. 1970. A probabilistic theory of causal ity. Amsterdam: North-Holland. 

Tatsuoka, M. M. 1971. Multivariate analysis: Techniques for educational and 
psychological research. New York: Wiley. 

Timaus, E. 1974. Experiment und Psychologie. Zur Sozialpsychologie psycholo- 
gischen Experimentierens. Gottingen: Hogrefe. 

Timm, N. H. 1975. Multivariate analysis with applications in education and psycholo- 
gy. Monterey, Cal.: Brooks/ Cole. 

von Wright, G. H . 1974. Erklaren und Verstehen. Frankfurt/ M .: Fischer. 

Weiner, B. 1972. Theories of motivation. From mechanism to cognition. Chicago: 
Markharn. 

Weiner, B. 1974. Achievement motivation as conceptualized by an attribution theorist. 
In: Weiner, B. Achievement motivation and attribution theory. Morristown, N . 
J.: General Learning Press. 

Wiley, D. E. 1973. The identification problem for structural equation models with 
unmeasured variables. In: Goldberger, A. S. & Duncan, O. D„ 69-83. 

Wilkening, K. & Wilkening, F. 1979. Versuchsplanung. Tubingen: Versuch fur das 
Fernstudium im Medienverbund. Kapitel 3. 

Winer, B.J. 1971. Statistical principles in experimental design. New York: McGraw- 
Hill. 

Wold, H. 1954. Causality and econometrics. Econometrica, 22, 162-177. 




Modelle zur kausalen Erklarung statistischer Zusammenhange 



153 



Wold, H. 1956. Causal inference from observational data, A review of ends and means. 
Journal of the Royal Statistical Society (A), 119, 28 - 61 . 

Wold, H. 1964. (Hrsg.). Model building in the human sciences. Monaco: Union 
europeenne d'editions. 

Wold, H. 1969. Mergers of economics and philosophy of science. Synthese, 20, 

427 - 482 . 

Wold, H . 1981. (H rsg.). The fix-point approach to interdependent systems. Amster- 
dam: North- Hoi I and. 

Wright, S. 1918. On the nature of size factors. Genetics, 3, 367-374. 

Wright, S. 1921. Correlation and Causation. Journal of Agricultural Research, 20, 

557 - 585 . 

Wright, S. 1923. The theory of path coefficients - A reply to Niles' criticism. Gene- 
tics, 8, 239-255. 

Wright, S. 1934. The method of path coefficients. Annals of Mathematical Statistics, 5, 
161-215. 

Wright, S. 1960a. Path coefficients and path regressions: alternative or complementary 
concepts? Biometrics, 16, 189-202. 

Wright, S. 1960b. The treatment of reciprocal interaction, with or without lag, in path 
analysis. Biometrics, 16, 423-445. 

Zimmermann, E. 1972. Das Experiment in den Sozialwissenschaften. Stuttgart: 
Teubner. 



Der vorliegende Beitrag ist eine revidierte Version meiner mit .Steyer (1982)' zitierten 
Dissertation. Den Gutachtern mochte ich fur wertvolle Diskussionen und kritische 
Anmerkungen danken: Prof. Dr. W. Bauer, Prof. Dr. H. Dinges, Prof. Dr. H. Moos- 
brugger und Prof. N . Wermuth, PhD. 




3. Kapitel 



Uni- und multivariate Varianzanalyse 
mit festen Parametern 

Helfried Moosbrugger und Rolf Steyer 



1. Einfiihrung und Uberblick 

Eine der am haufigsten auftretenden Fragen in der bio- und sozialwissen- 
schaftlichen Forschung ist die, ob M ittelwerteunterschiede zwischen zwei 
Oder mehr als zwei Gruppen bezuglich eines bestimmten „gemessenen" Merk- 
mals bestehen. Diese Frage kann durch einfaches Vergleichen der Mittelwerte 
in den Gruppen nicht zufriedenstellend entschieden werden, wenn nur eine 
Sti chprobe von Gruppenmitgliedern untersucht wurde, aber dennoch eine 
Aussage fur die Population, d.h. fur alle Gruppenmitglieder getroffen werden 
soil. 

Die erste exakte Losung fur den Fall zweier Gruppen wurde 1908 von Gosset 
unter dem Pseudonym „Student" (vgl. z.B. Pearson & Wishart, 1943) verof- 
fentlicht und ist unter der Bezeichnung t-Test auch heute noch eines der am 
haufigsten verwendeten inferenzstatistischen Verfahren. 

Fur den Fall mehrerer Gruppen hat Fisher (1925, 1935) die „grundlegenden 
Prinzipien der Varianzanalyse und ihre wichtigsten Techniken ausgearbeitet 
und publ iziert" (Stanley, 1978, S. 541, Ubersetzung durch die Autoren). 
SchlieBlich wurde von Roy (z.B. 1939, 1946, 1957) die multivariate Varianz- 
analyse entwickelt (vgl. Stanley, 1978, S. 553), mit der man M ittelwerteunter- 
schiede mehrerer Gruppen hinsichtlich mehrerer „gemessener" Merkmale un- 
tersuchen kann. 

Seit Cohens (1968) Artikel uber ..Multiple Regression als ein allgemeines Sy- 
stem zur Datenanalyse" (Ubersetzung durch die Autoren) ist in den Fachzeit- 
schriften der Psychologie eine Vielzahl von Arbeiten erschienen, die auf die 
allgemeine Theorie linearer Modelle eingehen, in welche die Varianzanalyse, 
wie z.B. auch die Regressionsanalyse, eingebettet werden kann (siehe z.B. 
Moosbrugger, 1978, Oder Steyer, 1979, und die dort angegebene Literatur). 
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Die Theorie linearer Modelle war aber bereits vorher in der mathematisch- 
statistischen Literatur bekannt und weit entwickelt (siehe z.B. Anderson, 
1958, Graybill, 1961, Oder Scheffe, 1959). 

Varianz- und Regressionsanalysen als Spezialfalle ein- und derselben Theorie 
zu behandeln wird dadurch moglich, daG sich M ittelwerteunterschiede einer 
Variablen in z.B. zwei Gruppen auch als Zusammenhang der betreffenden 
Variablen mit einer zweistufigen Kodiervariablen, welche die Gruppenzuge- 
horigkeit anzeigt, darstellen lassen. Zusammenhange zwischen zwei Variablen 
aber werden gewohnlich mit Methoden der Regressions- und Korrelationsana- 
lyse untersucht. 

In dem vorliegenden Beitrag stellen wir die u.E. wichtigsten Begriffe der 
Theorie multivariater linearer Modelle mit festen Parametern dar und zeigen 
exemplarisch, wie auf dieser Basis verschiedene varianzanalytische Fragestel- 
lungen zu bearbeiten sind. Gegenuber der herkommlichen Darstellung hat dies 
vor allem didaktische und konzeptuelle Vorteile; didaktische, weil nur wenige 
Grundbegriffe vermittelt werden mussen, und konzeptuelle, weil der Ansatz 
sehr allgemein ist. 

Im zweiten Abschnitt stellen wir die Grundbegriffe der hier behandelten 
Theorie dar. Im dritten Abschnitt fuhren wir die multivariate allgemeine li- 
neare Hypothese ein und erlautern deren Anwendung an einer Reihe verschie- 
dener Designs. Dabei legen wir das „ZellenmittelwertemodeH" zugrunde, bei 
dem die Parametermatrix eines linearen Modells die Zellenmittelwerte der 
abhangigen Variablen als Komponenten enthalt. 

Im vierten Abschnitt behandeln wir dann Fragen der Parameterschatzung und 
im filnften schlieRlich solche der Flypothesenbewertung, wobei wir beide The- 
menkomplexe fur den allgemeinen Fall abhandeln, bei dem die Matrix der 
unabhangigen Variablen nicht vollen Spaltenrang haben muR. 

In alien Abschnitten setzen wir einige Grundkenntnisse der Matrixalgebra 
voraus, in welche z.B. Moosbrugger (1978), Searle (1966) Oder Van de Geer 
(1971) einfuhren. 



2. Multivariate lineare Modelle mit festen Parametern 

2. 1 Einleitung 



In diesem zweiten Abschnitt wird diejenige Klasse von linearen statistischen 
Modellen formal charakterisiert, mit denen wir uns im weiteren Verlauf dieses 
Kapitels beschaftigen. Dabei werden wir zunachst in die grundlegenden Ideen 
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einfuhren und dann die Verbindung dieser Ideen mit Beobachtungseinheiten 
(z.B. Personen) und Stichproben herstellen. 

Von vielen Autoren wird die hier dargestellte Theorie unter der Bezeichnung 
„AMgemeines (multivariates) lineares Modell" abgehandelt (siehe z.B. Finn, 
1974, Graybill, 1976, Horton, 1978, Mendenhall, 1968, Moosbrugger, 1978, 
Steyer, 1979), eine Bezeichnung, die Verwirrung stiften konnte, da sie die 
Annahme nahelegt, es handele sich hier um die allgemeinste Form linearer 
Modelle. Dies ist aber nicht der Fall, was man schon daran erkennen kann, daB 
etwa die „random" und „mixed effects" Modelle (vgl. z.B. Searle, 1971, 
S. 376ff.) nicht unter diese Kategorie fallen, genausowenig wie lineare Modelle 
mit stochastischen Pradiktoren (vgl. z.B. Graybill, 1976. Kap. 10). 



2.2 Die grundlegenden Modellvorstellungen 

In diesem Beitrag betrachten wir ausschlieBlich Modelle, bei denen fur die 
stochastischen Vektoren y = (yi,y 2 ,- . . ,y P ) von „abhangigen" Variablen und 
x = (X]X 2 > ■ ■ ■ ,Xq) von „unabhangigen" Variablen die Gleichung 

(2.2.1) £(j|x) = xB 

(B ist ein groBes griechisches Beta) gilt, welche die P einzelnen Gleichungen 

(2.2.2) E(y p | x u x 2 , . . . ,x Q ) = xfi p = $ p ^ + |3 p2 x 2 + . . . + (3 pQ x Q 

enthalt. Demnach ist die bedingte Erwartung 1 ) einer abhangigen Variablen y P , 
p e {1,2 ,..., P}, unter x p , q e {1,2 ,..., Q}, eine mit den festen Parametern |3 pq 
gewichtete Summe der unabhangigen Variablen x p . Die Koeffizienten |3 pq , die 
auch partielle Regressionskoeffizienten genannt werden (vgl. z.B. Gaensslen 
& Schubo, 1973, S. 92) geben an, wie stark erwartungsgemaB zwei Werte von 
y p differieren, wenn sich die zugehorigen Werte von x p um den Betrag Eins 
unterscheiden, falls die Werte aller anderen unabhangigen Variablen x q „, q* 
q, gleich bleiben. 

In der Varianzanalyse handelt es sich bei jedem y p , p e {1,2,. . . ,P}, um eine 
quantitative Variable und bei den Xq, q e {1,2,. . . ,Q}, um qualitative Varia- 
blen, welche Gruppenzugehorigkeiten durch Zahlen wie z.B. 0 Oder 1 an- 

zeigen. 



’) Man beachte, dafi es sich bei der bedingten Erwartung um eine stochastische Varia- 
ble handelt, im Unterschied zum bedingten Erwartungswert. Zur Definition dieser 
Begriffe der Wahrscheinlichkeitstheorie verweisen wir auf Bauer (1974) oder Muller 
(1975). Gleichungen filr bedingte Erwartungen gelten nur mit Wahrscheinlichkeit 1, 
worauf wir im folgenden nicht weiter hinweisen. 
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Wir erlautern nun Gleichung 2.2.1 fur einige bekannte statistische: Model le. 
Das einfachste aller denkbaren Modelle (mit P=l und Q=l) ist 

(2.2.3) E(y\x) = |3 • 1 = p, 
welches auch in der Form 

(2.2.4) E(y) = it 

geschrieben werden kann. Damit wird die Annahme formuliert, da(5 eine sto- 
chastische Variable y einen Erwartungswert hat, namlich p bzw. (3. Die stocha- 
stische Variable x ist hier zu der Konstanten Eins „degeneriert", weswegen in 
diesem Fall auch E(y | x) = E(y) gilt. In einer Stichprobensituation ist hiermit 
oft die bekannte Fragestellung verbunden, ob ein Stichprobenmittelwert „si- 
gnifikant" von p abweicht (vgl. z.B. Bortz, 1977, S. 15&-160). 

Ein ebenso bekanntes Modell mit P=1 und Q=2 liegt vor, wenn der stochasti- 
sehe Vektor x in Gleichung 2.2.5 nur die beiden Auspragungen 

x x = LI 0] und x 2 = [0 I] 

annehmen kann: 

(2.2.5) E(y | At) = xP = Pi*i + P 2 *2- 
Es ist dann mit den beiden Gleichungen 

(2.2.6) £(y 1*11 = 1, *21=0) = Pi-1 + p 2 -o = Pj 

und 

(2.2.7) E(y |* 12 =0, x 22 =l) = p r 0 + p 2 -l = p 2 
gleichbedeutend. 

Dieses Modell kann man auch mit den Parametern pj statt Pj und p 2 statt p 2 
schreiben, wobei p x als Erwartungswert der abhangigen Variablen y in einer 
ersten und p 2 als deren Erwartungswert in einer zweiten Gruppe zu interpre- 
tieren ist. In einer Stichprobensituation ist mit diesem Modell oft die Fragestel- 
lung verbunden, ob zwei Stichprobenmittelwerte „signifikant" voneinander 
abweichen (vgl. z.B. Bortz, 1977, S. 160-164). Fur Q=3 lautet die Modell- 
glei chung 

(2.2.8) E(y\x) = PjX, + p 2 * 2 + p 3 x 3 

Im Fall dreier Gruppen hat der stochastische Vektor x nur die drei Auspra- 
gungen 
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Xi = [1 0 0], 
x 2 = [0 1 0] 
und x 3 = [0 0 1] 

Gleichung (2.2.7) ist dann mit den drei Gleichungen 

£0 Un = l, * 2 i = 0, *3i = 0) = Pi-1 + p 2 -o + |3 3 -0 = Pi 

E(y |*i2=0, *22=1, * 3 2=0) = p r 0 + p 2 -l + p 3 -0 = p 2 

E(y 1*13=0, *23=0, x 33 =i) = Pi-o + p 2 -o + p 3 -i = p 3 

Oder 

(2.2.9) E(y |*=x q ) = P q , q € {1,2,3}, 
gleichbedeutend. 

Eine verbreitetere Schreibweise dafur ist jedoch 

(2.2.10) E(y | *=Xq) = R q = R + (ft q - p) = R + a q , q e {1,2,3}, 

wobei a q := R q - r. M it diesem Modell ist in Stichprobensituationen oft die 
varianzanalytische F ragestel lung verbunden, ob zwischen den Q=3 Gruppen 
„signifikante" Mittelwerteunterschiede bestehen. 

Nachdem wir mit diesen einfachen Beispielen die Gleichung 2.2.1 erlautert 
haben, kehren wir zur Darstellung der allgemeinen Theorie zuruck. 

Aus der Gleichung 2.2.1 lassen sich eine Reihe von Eigenschaften eines linea- 
ren Modells ableiten. Betrachten wir z.B. den Residualvektor vom Typ lxP 

(2.2.11) e:=y-E(y\x) 

(e ist ein kleines griechisches Epsilon), so gelten dafur nach den Regeln 4, 5 
und 10 des Anhangs C von Moosbrugger (1982), in diesem Band, 

(2.2.12) £(i-|x) = 0, 

nach Regel 1 jenes Anhangs 

(2.2.13) E(e) = 0 

und nach Regel 11 jenes Anhangs 

(2.2.14) E(x'e) = C(x,e) - O 

wobei x' ein Spaltenvektor vom Typ Q x 1 ist. 
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Nach Gleichung 2.2.12 ist die bedingte Erwartung von e unter x = 
(XX.X2,. . . ,Xq) gleich Null, wie auch der unbedingte Erwartungswert von e 
(Gleichung 2.2.13). Wenn die bedingte Erwartung von e gegeben x 1 ,x 2 ,. . . ,Xq 
und damit auch die bedingten Erwartungswerte fur alle Auspragungskombina- 
tionen der x p gleich Null sind, dann kann auch keine Residualvariable e p mit 
einem x q kovariieren (Gleichung 2.2.14) Oder korrelieren. 

Aus der Gleichung 2.2.1 folgt, wenn E(x'x) nonsingular ist, die I dentifi ka- 
tionsgleichung fur die Parametermatrix B (vgl. M oosbrugger, 1982, in diesem 
Band, Kap. 2.2.3). 

(2.2.15) B = E(x’xY' i E(x'y). 



Von praktischem Interesse sind neben den Parametern in der Matrix B, die 
u.a. zur Pradiktion dienen konnen, auch die durch die x 1 ,x 2 ,. . . ,xq, also durch 
x bestimmte Varianz V[£(y p |jc)] einer „abhangigen" Variablen y p , fur die nach 
Gleichung 2.2.2 

(2.2.16) V[E(y v \x)) - C(*P p) *P p ) = 

(2.2.17) = P' p C{x,x) p p = 

(2.2.18) = V(y p ) - V(£ p ) 



gilt (siehe Gleichung B.5 und Regel 2 des Anhangs B von Moosbrugger, 1982, 
in diesem Band). Sie ist ein Kennwert fur die Giite der Pradiktion Oder fur die 
Starke des Zusammenhangs zwischen y p und x, ebenso wie der durch x be- 
stimmte Varianzantei I von y p , der multiple D etermi nationskoeffizient 



(2.2.19) 




V[E(y p \x)] 

V(y P ) 



V(y p)— V(e p ) 
V(y p ) 



Dieser ist von groBem praktischen Interesse, weil er ein normiertes M aB fur die 
praktische Bedeutsamkeit (vgl. z.B. Bredenkamp, 1970) eines statistischen Zu- 
sammenhangs zwischen y p und x ist, insofern, als R 2 y | x - 100% den durch x 
bestimmten Prozentanteil der Varianz von y p angibt. 

Die positive Wurzel von R y ix heiBt mu 1 1 i pi er Korrelationskoeffizient, der 
ebenso wie der multiple Determinationskoeffizient Werte zwischen Null und 
Eins annehmen kann. Der Wert Eins steht dabei fur einen perfekten Zusam- 
menhang, der eine fehlerfreie Vorhersage von y p aufgrund der Werte der Xq 
ermoglicht, und R y lx gleich Null besagt, daB die Kenntnis der Werte der x p 
keine bessere Vorhersage von y p ermoglicht als deren Erwartungswert E(y p ). 
Dies ist immer dann der Fall, wenn alle Parameter P pq , q e {1,2,. . . ,Q}, gleich 
Null sind, und kein Unterschied zwischen der bedingten Erwartung E(y p |x) 
und dem (unbedingten) Erwartungswert E(y p ) besteht. 
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Skalare Kennwerte der praktischen Bedeutsamkeit fur den Fall mehrerer ab- 
hangiger Variablen (P > 2) sind weniger eindeutig anzugeben, da zunachst 
nicht nur ein einziger Kennwert fur die Streubreite einer abhangigen Variablen 
y p , namlich die Varianz V(y p ), vorliegt, sondern eine symmetrische PxP- 
Kovarianzmatrix der Komponenten von y. Analog zum univariaten Fall kann 
man zunachst jedoch die durch x bestimmte Kovarianzmatrix von y 

(2.2.20) C[E(y |x), E(y |x)] = C[xB, xB] = B'C(x,x) B = 

(2.2.21) = C(y,y) - C(e,e ) 

angeben (siehe Gleichung B.5 und Regel 2 des Anhangs B von Moosbrugger, 
1982, in diesem Band). Ebenso wie im univariaten Fall konnen wir diese 
Kovarianzmatrizen auf die Kovarianzmatrix C(y,y) der abhangigen Variablen 
normieren, indem wir die Gleichung 2.2.21 mit C(y,y) 1 nachmultiplizieren, 
wodurch wir bei Nonsingularitat von C(y,y) die zu 2.2.19 analoge Gleichung 

(2.2.22) C[E(y\x), E(y |x)] C(y,y)~ l = [ C(y,y ) - C(e,e)] C(y,yY x 
erhalten. Ausmultiplizieren und Umstellen ergibt 

(2.2.23) C[E(y |x), E(y |x)] C(y, y r l + C(e,e) C(y,y )~ 1 = I, 

woraus man ersieht, daR sich der durch x bestimmte Anteil der Kovarianzma- 
trix (der linke Summand) und deren unbestimmter Anteil (der rechte Sum- 
mand) zur Einheitsmatrix I aufaddieren. Ausgehend von diesen Matrizen wur- 
den eine Reihe von multivariaten Verallgemeinerungen des Determinationsko- 
effizienten vorgeschlagen, die z.B. bei Shaffer und Gillo (1974) diskutiert 
werden. Am plausibelsten erscheint uns jedoch der Vorschlag von Cramer und 
Nicewander (1979), die den Schatzer fur den Kennwert 

(2.2.24) R], x := Spur[C[E(y\x), E(y |x)] CCy.y)- 1 ] 

als multivariaten D eterminationskoeffizienten favorisieren. Dabei ist 

(2.2.25) P = Spur[C(y,y ) C(y,y)~'] = Spur I 

die Anzahl der Komponenten von y und zugleich der Rang von C(y,y). Dieser 
Kennwert ist invariant gegenuber linearen Skalentransformationen von y, liegt 
zwischen Null und Eins, reduziert sich im univariaten Fall auf den Determina- 
tionskoeffizienten R 2 y[x (siehe Gleichung 2.2.19) und addiert sich mit 

Spur[C(e,e) C(y,y)~'] 

P 

zu Eins auf. AuRerdem besteht ein sehr enger Zusammenhang dieses multiva- 
riaten Determinationskoeffizienten zum Pill ai -Bartl ett Spur-Kriterium, wel- 
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ches wir neben anderen multivariaten Testkriterien im Abschnitt 5 behandeln 
werden. 

2.3 Stichprobenmodelle 

In Abschnitt 2.2 haben wir die lineare Modellgleichung 

(2.3.1) E(y\x)=xR 

formuliert. Es stellt sich nun die Frage, wie man die in der Regel unbekannten 
Parameter in der Matrix B schatzen kann. In der psychologischen Forschung 
geben die Werte der stochastischen Variablen in y und x Merkmale von Beob- 
achtungseinheiten, z.B. Versuchspersonen, wieder. Bei den abhangigen Varia- 
blen handelt es sich um Messungen einer (P= 1) Oder mehrerer (P> 1) Eigen- 
schaften einer Beobachtungseinheit, und bei den unabhangigen Variablen z.B. 
um Indikatoren der Zugehorigkeit zu einer Gruppe (z. B. Experimental- Oder 
Kontrollgruppe). 

Um ein Verfahren zur Schatzung der Parametermatrix B entwickeln zu kon- 
nen, mussen wir unsere Vorstellungen uber die uns vorliegenden N Beobach- 
tungseinheiten prazisieren. Die Beobachtungseinheiten konnen entweder ver- 
schiedene Vpn sein Oder Person-Zeit-Kombinationen, namlich Personen zu 
verschiedenen MeBzeitpunkten. Zunachst legen wir test, daB die Gleichung 
2.3.1 fur jede der N Beobachtungseinheiten gelten soil: 

(2.3.2) E(y n |x n ) = x n B, ftir alle n e {1,2,...,N}. 

Fur varianzanalytische Fragestellungen liegt typischerweise mit jeder Beob- 
achtungseinheit auch deren Gruppenzugehorigkeit test und somit auch die 
Realisierung x, des Vektors der unabhangigen Variablen x n . 2 ) Bei den abhangi- 
gen Variablen in y n hingegen liegen in der Varianzanalyse bei gegebener Beob- 
achtungseinheit n die Realisierungen y n des stochastischen Vektors y n noch 
nicht test, d.h. auch bei gegebener Beobachtungseinheit lieBe sich prinzipiell 
eine Variation der betreffenden Variablen feststellen. 

Da bei gegebener Beobachtungseinheit n der stochastische Vektor x n mit seiner 
Realisierung x n identisch ist, gilt auBer E(y n |x n ) = x n B auch 

(2.3.3) E(y a \x n ) = £(y n |x n =x n ) = E(y n ) 
und 

(2.3.4) E{y n ) = E[E(y n \ x n )J = £(x n B) = x n B, n e {1,2,...,N} 



2 ) Diese Eigenschaft unterscheidet die hier behandelten Modelle von solchen mit „sto- 
chastischen Regressoren“, uber welche z.B. Graybill, 1976, S. 373ff., infomiiert. 
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(siehe Regel 1 des Anhangs C und Regel 1 des Anhangs A von Moosbrugger, 
1982, in diesem Band). 

Aus Gleichung 2.3.3 und 2.3.4 ist ersichtlich, daB das Stichprobenmodell 
einfach wie folgt geschrieben werden kann: 

(2.3.5) E(y n ) = x n B, fur alle n e {1,2,..., N}. 

Es ist nutzlich diese N-Gleichungen mit einer Matrizengleichung zu notieren, 
wobei die folgenden Matrizen verwendet werden: 



Y bestehend aus N x P stochastischen Variablen, 



y in • • • ov ■ • ■ >y ip 



(2.3.6) 



Y 



y nil ■ • ■ np> • * ■ ^y nP 1 



UVNlJ • • ■ J^Npj ■ • • >(Vnp J 



X bestehend aus N x Q festen reellen Zahlen 

[" x 31> • * • > X lq> ■ • • > X 1Q 1 



(2.3.7) 


x = 


Xnl, • • • 


>X n qj • • 


i x nQ 






. X N1) • • 




• > x NQ. 


und 










B bestehend 


aus Q x 


P fester 


reellen 


Zahlen 






Pi i, ■ • • 


>Pipj • • • 


> Pip 


(2.3.8) 


B = 


Pql> • • • 


>Pqp> • • 


> PqP 






. PQ1, • • • 


>pQp> • • 


>Pqp . 
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Fur alle N Beobachtungseinheiten zusammen lautet das Stichprobenmodell 
dann in Matrizenschreibweise 

(2.3.9) E(Y) = X B. 

Die Annahme der Gleichheit der Parametermatrix B fur alle Beobachtungsein- 
heiten in Gleichung 2.3.9 wird noch durch eine Annahme uber die Kovarianz- 
matrix der Residualvektoren 

(2.3.10) £ n := Jn - x n B 
erganzt, namlich durch 

! £, fiir n = n* 

fiir alle n,n* e {1,2,...,N}. 

O, fiir n =A n* 

Dies bedeutet, daR die PxP-Kovarianzmatrix £ der Residuen der abhangigen 
Variablen fur jededer N Beobachtungseinheiten gleich ist und daR die PxP Kova- 
rianzmatrizen der Residuen der abhangigen Variablen verschiedener Beobach- 
tungseinheiten als Nullmatrizen angenommen werden. 3 ) 

Ob es zweckmaRig ist, mit dem Index n eine Person Oder eine Person-Zeit-Kombi- 
nation zu bezeichnen, entscheiden wir in einem Anwendungsfall danach, ob dann 
Gleichung 2.3.11 angenommen werden kann Oder nicht. Man kann annehmen, daR 
die Kovarianzmatrix C(e n ,£ n ») fur zwei verschiedene Beobachtungseinheiten n 
s 6 n* z.B. dann gleich der Nullmatrix ist, wenn y n und y n «, die abhangigen 
Variablen von zwei verschiedenen Personen enthalt und eine gegenseitige Be- 
einflussung, wie z.B. Abschreiben bei einem Test, ausgeschlossen ist. Wenn y n 
und y n * Beobachtungen der gleichen Person zu verschiedenen Zeitpunkten 
enthalt, kann diese Annahme u. U. auch als erf u 1 1 1 angesehen werden. Bei den 
herkommlichen Designs mit wiederholten Messungen (vgl. z.B. Hays, 1973, 
S. 568ff.) beispielsweise, macht man diese Annahme. 

Sind wir bereit, die Annahme der Gleichung 2.3.11 zu akzeptieren, wenn n 
eine Person-Zeit-Kombination indiziert, dann schreiben wir die Zeilenvekto- 
ren der abhangigen Variablen fur die verschiedenen Zeitpunkte der Messungen 
einer Person untereinander, d.h. der Index n weist dann nicht auf eine Person, 
sondern auf die Person zum Zeitpunkt t hin. 

Konnen wir aus theoretischen Uberlegungen Oder auf Grund eines statisti- 
schen Tests die Gleichung 2.3.11 fur Person-Zeit-Kombinationen n nicht ak- 
zeptieren, so fassen wir die an den Personen wiederholten Messungen als 
Realisationen von (formal gesehen) weiteren abhangigen Variablen auf. Hatten 



3 ) Ini univariaten Fall (P=l) reduziert sich die Matrix £ zu dem Skalar a 2 = o„. 
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wir zunachst 2 abhangige Variablen dreimal gemessen, so hatten wir nach der 
Umstrukturierung 2x3 = 6 abhangige Variablen vorliegen. GemaB Gleichung 
2.3.11 durfen die Residuen dieser 6 abhangigen Variablen miteinander korre- 
lieren, wobei £ deren Kovarianzmatrix ist. 

Die Gleichungen 2.3.9 bis 2.3.11 werden in der Literatur haufig als ,,mu Iti va- 
riate Gauss-M arkoff setup" und Gleichung 2.3.9 als ,,mu Iti variates allgemeines 
lineares M odell" bezeichnet. In diesem Artikel werden wir uns ausschlieGlich 
mit Modellen befassen, welche diese Gleichungen erfullen. Fur einige andere 
Modelle geben wir Literaturhinweise. 



2.4 Zusammenfassende Bemerkungen 

In diesem zweiten Abschnitt haben wir die grundlegenden Vorstellungen der 
hier behandelten Klasse von linearen statistischen Modellen dargestellt. Dabei 
handelt es sich um die lineare Model Igleichung, die Identifikationsgleichung, 
die Begriffe bestimmte Varianz und Determinationskoeffizient sowie um de- 
ren Verallgemeinerung im multivariaten Fall, bei dem mehrere abhangige Va- 
riablen vorliegen. 

Auf der Stichprobenebene sind die wesentlichen Annahmen, daG mit einer 
Beobachtungseinheit auch die Realisation x des stochastischen Vektors x der 
unabhangigen Variablen festliegt („nicht-stochastische Regressoren"), daR die 
Parametermatrix B nicht-stochastische Koeffizienten enthalt („fixed-effects"), 
die fur alle Beobachtungseinheiten gleichermaBen gelten, daR die Kovarianz- 
matrix der Residuen der P abhangigen Variablen bei gegebener Beobachtungs- 
einheit n fur alle N Beobachtungseinheiten gleich ist (siehe Gleichung 2.3.11), 
und daB diese Residuen fur unterschiedliche Beobachtungseinheiten unkorre- 
liert sind. 

W eiterfuhrende Literatur: Die Literatur liber lineare Modelle oder das ,,Allgemeine 
lineare Modell“ ist im letzten Jahrzehnt fast unubersehbar geworden. Zunachst seien 
ohne Anspruch auf Vollstandigkeit einige Monographien genannt, die zur Einfuhrung 
in die hier behandelte stochastische Theorie dienen konnen: Bock (1975). Cohen und 
Cohen (1975), Edwards (1976), Ezekiel und Fox (1959), Finn (1974), Fraser (1979), 
Gaensslen und Schubo (1976), Graybill (1976), Horton (1978), Krafft (1978), Linde- 
man et al. (1980), Mendenhall (1968), Moosbrugger (1978), Namboodiri et al. (1975), 
Overall und Klett (1972), Rao (1973), Schach und Schafer (1978), Searle (1971), Seber 
(1980), Tatsuoka (1971), Timm (1975), Ward und Jennings (1973) sowie Winer (1971). 

Zu Einfuhrung in lineare Modelle mit stochastischen Parametern (..random effects 1 ') 
seien Ahrens und Lauter (1981), Hild (1977) und Searle (1971, Kap. 9-11), genannt, 
Modelle mit stochastischen Regressoren behandeln u.a. Graybill (1976) oder Johnston 
(1971). 
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3. Hypothesenformulierung in verschiedenen Designs 
3.1 Einleitung 

Die Schatzung von Parametern, Berechnung von Teststatistiken, Uberschrei- 
tungswahrscheinlichkeiten etc., zur hier dargestellten allgemeinen Theorie 
sind heute, sofern Rechenanlagen verfugbar sind, weitgehend automatisiert 
durchfuhrbar und fur den Psychologen daher nicht von primarem Interesse. 
Dieser muB lediglich entscheiden, ob die dabei vorausgesetzten Annahmen 
erfullt sind. Unabdingbar wichtig ist fur jeden Psychologen jedoch das Wis- 
sen, welche Hypothesen er in welcher Situation untersuchen soil. Im folgen- 
den werden wir daher zunachst auf die Hypothesenformulierung fur verschie- 
dene Designs eingehen, womit zugleich ein Eindruck vermittelt werden soil, 
wie weit gespannt der Anwendungsbereich der hier dargestellten Theorie ist, 
aber auch, wo dessen Grenzen liegen. Die Formulierung und Formalisierung 
von Hypothesen ist auBerdem jener Bereich, der am wenigstens automatisiert 
werden kann und sollte. 

Bei der Behandlung der Designs werden wir vom Z el len mittel wertemodel I 
ausgehen, bei dem die Parameter in der Matrix B als bedingte Erwartungswerte 
der abhangigen Variablen in den Zellen des Designs interpretiert werden kon- 
nen. Die Besonderheiten dieses Modells werden wir im Abschnitt 3.2 behan- 
deln. Im Abschnitt 3.3 wird die allgemeine multivariate lineare Hypothese 
eingefuhrt, und ihre Anwendung in den Abschnitten 3.4 bei 3.9 an verschiede- 
nen Designs erlautert. Dabei gehen wir auf kreuzfaktorielle Designs, solche 
mit hierarchischen Faktoren und auf lateinische Quadrate ein. Bei alien De- 
signs setzen wir gleiche Zellenfrequenzen voraus. Fur nonorthogonale Designs 
sei auf die entsprechende Spezialliteratur, z.B. Appelbaum und Cramer 
(1974), Herr und Gaebelein (1978), Overall und Spiegel (1973a, b), Overall, 
Spiegel und Cohen (1975), Rawlings (1972, 1973) Oder Steyer (1979), hinge- 
wiesen. 



3.2 Das Zellenmittelwertemodell 

Bei alien im folgenden behandelten Designs werden wir das .Zellenmittelwer- 
temodell" zugrunde legen, in welchem die Parameter (3 qp in der Matrix B nichts 
anderes als die Erwartungswerte p pp der Variablen y p in der q-ten Zelle eines 
Designs sind. 4 ) 



4 ) Timm und Carlson (1975) benutzen fur diesen Ansatz die Bezeichnung „Modell 
vollen Ranges", die wir aber fur ungeeignet halten, da noch viele andere Modelle 
existieren, bei denen die Matrix X vollen Rang hat, bei denen also die Anzahl der 
Spalten von X gleich dem Rang von X ist, ohne die genannten Eigenschaften zu be- 
sitzen. 
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Die Regel fur die Kodierung der Gruppenzugehorigkeit einer Beobachtungs- 
einheit (Be) als Vektor der unabhangigen Variablen x p ist dann besonders 
einfach. Fur jede Zelle benotigen wir dann eine unabhangige Variable x p , die 
folgendermaBen definiert ist: 



) 1, wenn die Be zur q-ten Zelle gehort 
0, andernfalls. 



Wir uberzeugen uns davon, daB dann |3 qp der bedingte Erwartungswert von y P 
in der q-ten Zelle ist. Dazu gehen wir von der Identifikationsgleichung 2.2.15 

B = E(x'x) 1 E(x'y) 



aus. Fur E(x'x) gilt in diesem Fall 



(3.2.1) E(x'x) = 



P(x 1 = 1 ) 



O 



O 

P(x Q =l) 



da die stochastische Variable Xq . x p », q, q* e {1,2, . . ., Q}, nur dann einen 
Wert ungleich Null annehmen kann, wenn q = q*. In diesem Fall nimmt 
Xq . Xq* = Xq . Xq den Wert Eins an, und aus der Definition des Erwartungswer- 
tes (siehe Gleichung A. I des Anhangs A von Moosbrugger in diesem Band) 
folgt £(x q Xq) — 1 P(x q ■ x q = 1) + 0 • P(x q • x q = 0) = P(x q = 1). 

Die Inverse einer solchen Diagonal matrix ist wiederum eine Diagonal matrix 
mit reziproken Werten der Ausgangsmatrix als Komponenten (vgl. z.B. 
Moosbrugger, 1978, S. 32). 



1 

P( Xl = l) 



(3.2.2) E(x'x). 1 = 



O 



O 



1 

P(x Q =l) 



Fur die Matrix E(x'y) schlieBlich erhalten wir 
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(3.2.3) E(x'y) 



£CviUi=i)- £(*i=i) ••• E(y P Ui=i) ■ <P(*i=i) 



E(yi U Q =i) • P(* Q =i) . . . £Cyp|x Q =i) -P(x Q =i) 



wobei wir fur jede Komponente dieser Matrix die Regel 

i 

[x ■ y) = Y, x i ' E (y I x=x 0 ' P(x=*d- 

i=l 



benutzen. Dabei sind x und y stochastische Variablen, wobei x jedoch diskret 
ist mit den 1 Realisationen X;. 

Ausmultiplizieren von E(x'x) 1 E(x'y) schlieRlich fuhrt zu 



Etyi Ui = l) == Rn 



(3.2.4) 



B 



£(?p |*i = l) =: Rip 



.£(?! *q=1) =: Rqi . . . £CVp|*q=1) =:Rq P . 



Diese Kodierungsweise nach dem Zellenmittelwertemodell hat nicht nur den 
Vorteil, dal$ die (3 qp einfach zu interpret eren sind, sondern auch die rechen- 
technischen Vorzuge, daR namlich ein Schatzer B von B ohne faktische Kodie- 
rung der Matrix X sofort berechnet werden kann, da(5 die Inverse von X'X immer 
existiert, es sei denn, in einer Zelle liegen keine Beobachtungen vor, und daft 
die Inverse von X'X sehr leicht, auch ohne Rechner, zu bilden ist, indem man 
einfach den reziproken Wert der jeweiligen Komponente der Matrix X'X 
nimmt, die ja selbst eine Diagonalmatrix der Zellenfrequenzen ist. 

Bei den im folgenden zu behandelnden Designs konnen wir also immer davon 
ausgehen, daft B die bedingten Erwartungswerte der P abhangigen Variablen in 
den Q Zellen enthalt, also die Zellenmittelwerte (i, qp . Die Residuen der P- 
dimensionalen Vektoren der abhangigen Variablen sind weder innerhalb einer 
solchen Zelle noch zwischen diesen Zellen voneinander abhangig (siehe Glei- 
chung 2.3.11). 
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3.3 Die multivariate allgemeine lineare Hypothese 

Bei alien in diesem Abschnitt 3 behandelten Designs lassen sich die Hypothe- 
sen uber die Parameter in der Matrix B in der Form der mu Itivariaten allge- 
meinen linearen Hypothese 

(3.3.1) H 0 : C B A = A 

formulieren, wobei C eine MxQ-Matrix mit M linear unabhangigen 5 ) Zeilen 
ist, B die Q x P-Parametermatrix, A eine P x K-Matrix mit K linear unabhangi- 
gen Spalten und A eine MxK-Matrix. Die Matrizen C, A und A sind gemaB 
der jeweiligen Hypothese vom Anwender zu spezifizieren, wobei mit C Hy- 
pothesen uber Parameter formuliert werden, die sich in jeweils einer Spalte 
von B befinden, und mit A Hypothesen uber Parameter, die sich jeweils in 
einer Zeile von B befinden. Auf Einzelheiten werden wir in den nachfolgenden 
Abschnitten ausfuhrlich eingehen. 

Einen Zeilenvektor tj> m = g, B I nennen wir einen einfachen P-variaten Ver- 
gleich der unabhangigen Variablen. Gilt dabei fur den Zeilenvektor c m auch 

(3.3.2) q„ i = a 

(1 ist ein passender Spalteneinheitsvektor), so sprechen wir auch von einem 
Kontrast anstatt von einem Vergleich. 

Einen Spaltenvektor tp k = I B a k nennen wir einen einfachen Q-variaten 
Vergleich der abhangigen Variablen, bzw. Kontrast, wenn dabei fur den Spal- 
tenvektor a k 

(3.3.3) l'a k = 0 
gilt. 

Mehrere solcher Zeilen- Oder Spaltenvektoren heiBen globaler Vergleich bzw. 
Kontrast. 

Die Koeffizientenvektoren zweier Vergleiche bzw. Kontraste und i(v> Oder 
% und heiBen orthogonal, wenn fur ihr Skalarprodukt 

(3.3.4) c m c' m . = 0 
Oder 

(3.3.5) a k ' a k *= 0 

5 ) Endlich viele Vektoren v^. . . ,v M eines Vektorraums heiBen linear unabhangig, 
wenn aus 0 ^+. . . + qv,v M = 0 immer c* = . . . = c M = 0 folgt (vgl. Kowalsky, 1969. 
S. 33). Sind v b . . „v M linear abhangig, so liiBt sich daher immer mindestens einer von 
ihnen als Linearkombination der anderen darstellen (vgl. z.B. auch Moosbrugger, 

1978, S. 35). 
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gilt. Bei gleichen Zellenfrequenzen sind dann auch die Vergleiche bzw. Kon- 
traste selbst orthogonal (d.h. unkorreliert). 

Im folgenden werden wir die Spezifizierung der Gleichung 3.3.1 bei verschie- 
denen Designs behandeln. 



3.4 Gekreuzte Faktoren iiber den unabhangigen Variablen 

Wir betrachten nun ein Design, bei dem bei jeder der N Beobachtungseinhei- 
ten genau P abhangige Variablen y 1( . . . ,y p erhoben werden, und bei dem jede 
dieser Beachtungseinheiten in genau eine von z.B. 6 Zellen gehort, die durch 
das Kreuzen eines Faktors A mit zwei Stufen und eines Faktors B mit drei 
Stufen entstehen (siehe Tabelle 3.1). Dabei kann es sich um experimentelle 
Faktoren handeln, Oder aber auch um solche, die man durch „reines Beobach- 
ten" 6 ) gewinnt, wie z.B. „Geschlecht", „Bildungsklasse" etc. 

Wir gehen zunachst von einer eher exploratorischen Situation aus, in der man 
keine gezielten Flypothesen hat. Bei einem solchen Design ist dann zunachst 
von Interesse, ob in einer Stichprobe uberhaupt „signifikante", d.h. uberzu- 
fallige M ittelwerteunterschiede zwischen den 6 Zellen vorliegen. Die verbal 
formulierte Nullhypothese besagt dann, daB alle sechs Erwartungswertevekto- 
ren p q = (|3 ql , . . . ,|3 q p), q e {1,2,..., 6}, gleich sind, Oder mit anderen Worten, 
daG weder ein Flaupteffekt von Faktor A, noch ein Flaupteffekt von Faktor B 
noch ein Wechselwirkungseffekt der Faktorstufenkombinationen AB besteht. 
Die Bedeutung dieser Begriffe erlautert z.B. Moosbrugger (1982) in diesem 
Band, S. 18-19. 

Prinzipiell lassen sich nun viele verschiedene Moglichkeiten denken, die globa- 
le Hypothese, dalS keine Unterschiede zwischen den sechs Zeilenvektoren P q 
bestehen, in der Form der multivariaten allgemeinen linearen Flypothese zu 
formulieren. Diese unterscheiden sich jedoch nicht in den resultierenden Qua- 
dratsummenmatrizen, mit denen man die Flypothesenbewertung durchfuhrt 
(siehe Abschnitt 5). 

Eine der einfachsten Moglichkeiten besteht darin, die Flypothese so zu formu- 
lieren, dafi alle benachbarten Zeilenvektoren P q bzw. H q gleich sind, d.h. dab 
deren Differenz jeweils gleich dem Nullvektor ist: 

fit - = 0 

- 1*3 = 0 

(3.4D H 0abab : H } - ft 4 = 0 

M"4 1^5 ~ 0 

l<5 Pt = 0. 

6 ) Edwards (1971, S. 8f.) fiihrt in dieser Kategorie z.B. „organismische“ Variablen an. 
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Tabelle 3.1: Gekreuzte Faktoren A und B als Gliederung der Q unabhangigen 
Variablen Xq, welche hier an insgesamt N = N x + . . . + N 6 Beob- 
achtungseinheiten erhoben wurden. Beispiel fur Faktor A: Ge- 
schlecht (A ^ 2 ), fur Faktor B: Altersstufen (B 1 ,B 2 ,B 3 ). Das Da- 
tenschema zeigt die P = 4 abhangigen Variablen y p pro Beobach- 
tungseinheit und deren bedingte Erwartungswerte (l qp . 
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Da gemaB Gleichung 3.2.4 
Hi 

(3.4.2) B = 

Be 

gilt, wahlen wir die folgende Hypothesenmatrix 

1 -1 0 0 0 o' 

01-1000 

(3.4.3) C A , B , AB = 0 0 1 -1 0 0, 

0 0 0 1 -1 0 

.00001-1 

wobei wir, falls nicht explizit anders angegeben, gleiche Zellenfrequenzen 
voraussetzen. 

Die Matrix A in der allgemeinen linearen Hypothese C B A = A erlaubt, die P 
abhangigen Variablen beliebig linear zusammenzufassen. Man kann damit 
praktisch neue abhangige Variablen bilden. In anderen Designs kann A jedoch 
auch die „Hauptrolle" beim Formulieren von Hypothesen spielen, wie wir 
weiter unten zeigen werden. 

A abab se i hier die PxP-Einheitsmatrix I, und A a , b , A b sine 5xP-Nullmatrix. 
Ausmultiplizieren von C A>B>AB B A abab = A A;BiAB fuhrt dann zu den Glei- 
chungen 3.4.1. Die so formulierte Hypothese laBt sich mit den in Abschnitt 5 
angegebenen Verfahren bewerten. Falls sich dabei ergibt, daB man die Null- 
hypothese beibehalten sollte, kann man das Verfahren hier abbrechen. An- 
dernfalls jedoch kann man mit der nachsten Hypothese fortfahren. 

Es ist dabei u.E. zu empfehlen, als nachstes die Nullhypothese zu untersu- 
chen, daft keine Interaktion (W echselwirkung) zwischen den Faktoren A und 
B bestehen, namlich, daB die Unterschiede zwischen den Erwartungswerte- 
vektoren der Stufen A, und A 2 auf alien Stufen von Faktor B gleich sind: 

(Bi - B-t) - (B2 - fi 5 ) = 0 

(3.4.4) H 0ab : 

(B 2 - Bs) - (B3 - Be) = 0. 

In der Form C B A = A wahlen wir 

1-1 0-1 1 0 

(3.4.5) C AB = 

0 1-1 0-1 1 
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A ab = 1 und A ab = 0. M ultipliziert man C AB B A ab = A ab aus, so erhalt man 
die Gleichungen 3.4.4. Die Bewertung fuhrt man wiederum mit den in Ab- 
schnitt 5 angegebenen Verfahren durch. 

Sol Ite man zu dem Ergebnis kommen, daR wohl keine Interaktionen vorliegen, 
so kann man die Haupteffekte der Faktoren A bzw. B mit den Nullhypothesen 
untersuchen, daR erstens die Summen der Erwartungswertevektoren auf den 
Stufen von Faktor A bzw. zweitens auf den Stufen von Faktor B gleich sind. 
Es ist u.E. auch dann sinnvoll, diese Flypothesen zu untersuchen, wenn eine 
Interaktion AxB besteht, falls man am durchschnittlichen Effekt z.B. des 
Faktors A uber die Stufen von B hinweg (bzw. umgekehrt) interessiert ist. 

Die Nullhypothese fur Faktor A kann man so formulieren: 

(3.4.6) H 0a : (Hi + ji 2 + fi 3 ) - (pi 4 + fi 5 + m) = 0. 

in der Form C B A = A wahlen wir 



(3.4.7) C A = [1 1 1-1 -1 -1], 

sowie A a = I und A a = 0. 

Die Nullhypothese fur Faktor B ist 

(hi + m) - (f»2 + h 5 ) = o 

(3.4.8) H 0b : 

(M-2 + Hs) - (f*3 + (*6) = 0 
und in der Form C B A = A ist dann 



(3.4.9) 



C B = 



1 -1 0 

0 1 -1 



1 -1 0 

0 1 -1 



A b = I und A B = 0 zu wahlen. Die Flypothesen fur die Flaupteffekte (vgl. 
auch Moosbrugger, 1978, S. 139-143) lassen sich mit den Verfahren bewer- 
ten, die in Abschnitt 5 angegeben sind. 

Wie ist nun die Flypothesen matrix C fur den Fall zu wahlen, daR man z.B. 
den , .Effekt" von Faktor A auf der Stufe 1 des Faktors B untersuchen will? 
Dazu ware einfach 

(3.4.10) C AIBl = [1 0 0 -1 0 0] 

zu setzen, was zusammen mit A A!Bi =1 und A a!Bi = 0 der Nullhypothese 



entspricht. 
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Man beachte, daB jede Zeile der Matrix C einer eigenen (Sub-) Hypothese 
entspricht, die man nach den gleichen allgemeinen Methoden des Abschnitts 5 
untersuchen kann. Solche gezielten Einzelvergleiche sind legitim, falls gezielte 
Hypothesen vor der Datenerhebung bestehen 7 ). 



Die Verallgemeinerung des hier behandelten Designs auf beliebig viele Fakto- 
ren mit beliebig vielen Stufen sol Ite keine Schwierigkeiten bereiten. Bei der 
Anordnung der Daten ist lediglich darauf zu achten, daB die Beobachtungsein- 
heiten n untereinander angeordnet werden, sofern man bereit ist, die Unab- 
hangigkeitsannahme (2.3.11) zu machen. 

Es wurde bereits weiter oben darauf hingewiesen, daB die hier gewahlten 
Hypothesen nicht die einzig moglichen und richtigen sind. Man konnte z.B. 
an der Frage interessiert sein, ob der Durchschnitt der Erwartungswerte in den 
Zellen 1, 2, 4 und 5 gleich dem Durchschnitt der Erwartungswerte in den 
Zellen 3 und 6 ist. Allgemein sind auch Hypothesen der Form C B A =A 0 
moglich. 

Zum AbschluB dieses Abschnitts sei davor gewarnt, zu viele Einzelvergleiche 
durchzufuhren. Dies fuhrt zu einer Akkumulation des a-Fehlers. Wenn bei 
einem Signifikanztest die Irrtumswahrscheinlichkeit fur die falschliche Ableh- 
nung der Nullhypothese a = 0.05 betragt, so liegt sie bei funf unabhangigen 
Signifikanztests auf diesem Niveau schon bei a 5 = 1 - (1 - a) 5 = 1-0.77, 
d.h. die Wahrscheinlichkeit bei funf unabhangigen Signifikanztests falsch- 
licherweise einen ,,signifikanten" zu finden, betragt a 5 = 0.23. Sind viele 
Signifikanztests durchzufuhren, sol Ite man daher auf die Verfahren „simulta- 
ner Mittelwertvergleiche" zuruckgreifen (vgl. Aitkin, 1969, z.B. Miller, 1966, 
Oder Gabriel, 1968, 1969a, b). 



3.5 Gekreuzte Faktoren iiber den abhangigen Variablen 

Wir betrachten nun die P abhangigen Variablen genauer und nehmen an, daB 
sie sich ebenfalls faktoriell gliedern lassen (siehe Tabelle 3.2), so, wie sich die 
Q unabhangigen Gruppen im vorangegangenen Abschnitt strukturieren lie- 
Ben. Die Aufteilung der Gruppen wollen wir hier zunachst nicht weiter beach- 
ten, da wir sie ja bereits im vorangegangenen Abschnitt behandelt haben. 



7 ) Andernfalls handelt es sich nicht um Hypothesentesten, sondem um die Exploration 
von Daten, und die dabei gefundenen „signifikanten“ Tests sollte man nicht als signifi- 
kant, sondern als statistisch auffallig bezeichnen, da die Irrtumswahrscheinlichkeitsan- 
gaben (a-Niveau) dann sehr irrefuhrend sein konnen. 




174 



Helfried Moosbrugger und Rolf Steyer 



Tabelle 3.2: Gekreuzte Faktoren U und V als Gliederung der P abhangigen 
Variablen y P , welche an insgesamt N =N t + . . . +N 6 Beobach- 
tungseinheiten (Ben) erhoben wurden. Dabei wird die Unabhan- 
gigkeitsannahme, die in Gleichung 2.3.11 enthalten ist, vorausge- 
setzt. Beispiel fur Faktor U: Schulleistungstests (U], U 2 ), fur 
Faktor V: Vortest (Vj), Nachtest (V 2 ). Das Datenschema zeigt die 
P = 4 abhangigen Variablen y P pro Be und deren bedingte Erwar- 
tungswerte p qp . 
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Die Faktoren U und V konnen in verschiedenen Forschungssituationen entste- 
hen: Falls man nicht bereit ist, die in Gleichung 2.3.11 enthaltene Unabhangig- 
keitsannahme zu machen, kann z.B. V x Vor- und V 2 Nachtest von 2 inhaltlich 
verschiedenen abhangigen Variablen (U 1( U 2 ) sein, Oder umgekehrt konnen U x 
und U 2 wiederholte Messungen von 2 inhaltlich verschiedenen abhangigen 
Variablen sein (V x und V 2 ). Genausogut kann es sich jedoch auch bei U x und 
U 2 und bei V x und V 2 um wiederholte Messungen handeln, wobei U 2 
aufeinanderfolgende experimentelle Versuchsbedingungen sind. Kann man 
hingegen die Annahme C(e m e n ») = 0 bei n n* fur die Residuenvektoren e n 
= y n - E(y n | x n ) machen, wobei y n und y n * die abhangigen Variablen derselben 
Person zu verschiedenen Zeitpunkten enthalt, so wurde man besser die MeR- 
wiederhol ungen „untereinander" anordnen, wodurch der Index n dann nicht 
mehr die Person, sondern eine Person-Zeit-Kombination bezeichnet. Wotta- 
wa (1981) hat ein Verfahren angegeben, wie die Annahme der Unabhangigkeit 
der Residuen uberpruft werden kann. 

Formal betrachtet haben wir von jeder Beobachtungseinheit hier insgesamt P 
= 2-2 abhangige Variablen vorliegen. Die Gleichungen 2.3.8 bis 2.3.11 werden 
also weiterhin vorausgesetzt, wobei hier N = N x + . . . + N 4 gilt, und 2 die 
Dimension PxP = 4x4 hat. 

Da wir auch hier ein Zellenmittelwertemodell zugrundelegen, sind die Para- 
meter in der Matrix B wiederum die Erwartungswerte der P=4 abhangigen 
Variablen in den Q=6 Zellen, deren Anordnung in Tabelle 3.2 wiedergegeben 
ist. 

In formaler H i nsicht unterscheidet sich das Design der Tabelle 3.2 nicht von 
dem der Tabelle 3.1. Der einzige Unterschied besteht darin, date hier die P = 
2.2 abhangigen Variablen untergliedert wurden, wobei die Untergliederungen 
der Q Gruppen nach den Faktoren A und B, die wir in Tabelle 3.1 vorgenom- 
men hatten, auRer acht gelassen wird. 

Die Hypothesen uber die Faktoren U, V und deren Interaktion UxV konnen 
nach der gleichen Methode wie im vorangegangenen Abschnitt formuliert wer- 
den. Der einzige Unterschied besteht darin, daR hier die Matrix A der multiva- 
riaten allgemeinen linearen Hypothese C B A = A Verwendung findet und C 
jeweils die Q x Q-Einheitsmatrix ist. Die einzelnen Flypothesenmatrizen A 
konnen dabei so gewahlt werden, wie die Flypothesenmatrizen C der entspre- 
chenden Flypothesen in Abschnitt 3.4, aber in transponierter Form. 

Bei einem Design wie dem vorliegenden konnen zusatzlich noch Interaktionen 
zwischen den „unabhangigen Faktoren" A und B (entsprechend Tabelle 3.1) 
und den „abhangigen Faktoren" U und V (entsprechend Tabelle 3.2) gepruft 
werden. So kann man z.B. die Nullhypothese formulieren, daR keine Interak- 
tion zwischen den Q Gruppen und den P abhangigen Variablen bestehen: 
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TT 

^ OfA . B . AB ) X ( U . V . UV )' 

(M-i i — M-12) — (1^21 — H22) = ■ ■ ■ = (M-6 i — M«) 

(Pl2 ~ M-n) = i\*-21 — fe) = ■ • • = (|%2 ~ M- 63 ) 

((^13 — R'h) = (P-23 — ^ 24 ) = • • • — (^63 — M^)- 



Anschaulich bedejtet das, daR die Differenzen zwischen den Erwartungswer- 
ten der P=4 abhangigen Variablen von den Q=6 Zellen nicht moderiert wer- 
den (vgl. Moosbrugger, 1982, in diesem Band, S. 19). Dabei konnen diese 
Differenzen zwischen den P=4 Variablen wohl verschieden sein. Diese Null- 
hypothese konnen wir auch in Form von 15 Differenzen anschreiben, welche 
Null sein mussen: 

(3.5.2) ^O(A.B.AB) x (U.V.UV)' 



(p-u - R 12 ) — (M21 — M 22 ) — (m-12 R 13 ) (M-22 M-23) — (M-13 Ru) (^23 0 

( M-2 1 — P22) — ( M-3 1 — ^32 ) = ( 1*22 ~ 1*23 ) — ( 1*32 — 1*33 ) ~ ( 1*23 ~ R24) — ( 1*33 — H-34) = 0 



(M'S! M-52) (M-61 M-62) — (^52 1*53 ) (l*62 l*®) - (l*53 P54) — ( M-63 ~ (*64) — 0 



Zur Formulierung dieser Wechselwirkungshypothese zwischen den unabhan- 
gigen und abhangigen Faktoren in der Form C B A = A wahlen wir 



(3.5.3) Ca.b.ab — 

und zugleich 

(3.5.4) A u>v ,uv = 



1 -1 0 0 0 0 
0 1-1 000 
00 1-1 00 
0001-10 
00001-1 



1 0 0 

-1 1 0 

0 -1 1 

0 0-1 



sowie A (AiBjAB)x(U>v ,uv) = 0. Ebensogut lieGen sich aber auch Flypothesen 
formulieren, daR keine Interaktionen A x U, A x V etc. bestehen. Nachdem 
einmal die Arbeit der Formulierung der Flypothesen in der Form C B A = A 
geleistet ist, konnen diese nach den Verfahren untersucht werden, die wir in 
Abschnitt 5 behandeln. 

Die Verallgemeinerung eines solchen Designs auch fur beliebig viele Faktoren 
uber den abhangigen Variablen ist offensichtlich. Bei der Festlegung des De- 
signs ist lediglich darauf zu achten, daR fur jede Be (z.B. Person Oder Person- 
Zeit-Kombination) die P abhangigen Variablen jeweils nebeneinander und die 
Beobachtungseinheiten untereinander angeordnet werden, so daB die Glei- 
chungen 2.3.6 bis 2.3.11 erf u 1 1 1 sind. 
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3.6 Hierarchische Faktoren iiber den unabhangigen Variablen 

Wir betrachten nun ein Design, bei dem ein funfstufiger Faktor B einem 
zweistufigen Faktor A hierarchisch untergeordnet ist, bei dem also jede Stufe 
von B nur mit einer Stufe des Faktors A zusammen vorkommt. Beide Faktoren 
strukturieren dabei die Q=5 Zellen, innerhalb derer sich dann insgesamt N = 
N x + . . . + N 5 P-dimensionale Vektoren abhangiger Variablen befinden. Ein 
typischer Fall ware, daft man P abhangige Variablen bei zwei verschiedenen 
Lehrmethoden (Faktor A) untersuchen will, wobei man die Schulkassen B x bis 
B 5 einbezieht. 

Wir setzen wieder voraus, dal5 die Zellenmittelwertekodierung fur X ange- 
wandt wurde, so daB B die 5 x P-Matrix der bedingten Erwartungswerte der 
abhangigen Variablen in den funf Zellen ist, und zwar in der gleichen Anord- 
nung wie diese in Tabelle 3.3 dargestellt sind. 

Bei einem solchen Design sind mehrere Flypothesen von Interesse. Eine erste 
globale Hypothese besagt, dal$ keine Unterschiede zwischen den Gruppen Bx 
bis B 5 bezuglich der Erwartungswerte der P abhangigen Variablen bestehen. 

Diese Hypothese laRt sich in der Form der allgemeinen multivariaten linearen 
Hypothese C B A = A darstellen, indem wir z.B. 



0 0 
0 0 
1 0 
1 -1 

A a B = I und A a3 = 0 wahlen. Falls die Bewertung nach den in Abschnitt 5 
angegebenen Verfahren ergibt, daB diese Hypothese beizubehalten sei, kann 
das Verfahren abgebrochen werden. Andernfalls uberprufen wir als zweite 
Hypothese, dal$ sich die Erwartungswerte der P abhangigen Variablen zwi- 
schen den Gruppen A| und A 2 nicht unterscheiden. Diese lalSt sich in der Form 
C B A = A formulieren, indem wir z.B. 

(3.6.2) C A = [1/2 1/2 -1/3 -1/3 -1/3], 

A a = I und A a = 0 wahlen. 

Der Faktor B ist unter Faktor A „genestet". Folglich konnen Hypothesen uber 
Faktor B nur auf den Stufen von Faktor A gepruft werden. Wir formulieren 
die dritte bzw. vierte Hypothese, daR sich die Erwartungswerte der P abhangi- 
gen Variablen zwischen den Gruppen Bx und B 2 bzw. B 3 bis B 5 auf der Stufe A x 
bzw. A 2 nicht unterscheiden, in der Form C B A = A, indem wir z.B. 



(3.6.1) 



1 -1 0 

0 1 -1 

0 0 1 

0 0 0 
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Tabelle 3.3 H ierarchische Faktoren A und B als Gliederung der Q unabhan- 
gigen Variablen x q , welche an insgesamt N = N x + . . . + N 5 
Beobachtungseinheiten erhoben wurden. Beispiel fur Faktor A: 
Lehrmethoden (A lf A 2 ), fur Faktor B: Schulklassen (Bx bis B 5 ). 
Faktor B ist derm Faktor A untergeordnet („genestet"), weil jede 
Stufe von B nur unter einer Stufe von A vorkommt. Das Daten- 
schema zeigt die P=5 abhangigen Variablen y P pro Beobach- 
tungseinheit und deren bedingte Erwartungswerte p qp . 
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(3.6.3) C BIA , = [ 1 -1 0 0 0 ] 

bei A bia =1 und A B ia = 0 bzw. 



Cri a, — 



1 -1 0 

0 1 -1 



(3.6.4) 

bei A b , a = I und A B i = 0 wahlen. 

Die beiden Hypothesen uber Faktor B konnen auch gemeinsam formuliert 
und uberpruft werden. 

Interaktionen zwischen den Faktoren A und B lassen sich bei einem hierarchi- 
schen Design nicht uberprufen. 



3.7 Hierarchische Faktoren iiber den abhangigen Variablen 

Das im vorangegangenen Abschnitt dargestellte Prinzip der Strukturierung der 
Beobachtungseinheiten durch hierarchische Faktoren laBt sich auch auf die 
abhangigen Variablen ubertragen. So ist z.B. denkbar, daft mit jeder Person 
fiinf Versuchsphasen (V x bis V 5 ) durchgefuhrt werden, die sich aber in zwei 
Hauptphasen (U x und U 2 ) aufgliedern lassen, wobei V 1 bis V 3 der Stufe U x 
untergeordnet sind und V 4 bis V 5 der Stufe U z . Sind wir aus theoretischen 
Grunden (z.B. wegen Existenz von „Lerneffekten") nicht in der Lage, die 
Gleichung 2.3.11 vorauszusetzen, wenn n eine Person-Zeit-Kombination in- 
diziert, so konnen wir die funf MeGwiederhol ungen als Realisationen von fiinf 
(formal verschiedenen) abhangigen Variablen auffassen, so daG n nun die Per- 
son angibt, von der jeweils 5 MeBwerte vorliegen. So umstrukturiert waren die 
Gleichungen 2.3.8 bis 2.3.11 wieder giiltig, wenn Abhangigkeiten zwischen 
den Personen ausgeschlossen werden konnen. 

In einer ersten globalen Nullhypothese behaupten wir, daB sich die Erwar- 
tungswerte der abhangigen Variablen zwischen den funf Versuchsphasen nicht 
unterscheiden. Dazu wiirde man C u v = I, A u>v = 0 und 



(3.7.1) 



A UiV = 



10 0 0 
-110 0 
0-110 
0 0-11 
0 0 0 -1 



wahlen. Dabei konnen sehr wohl Unterschiede zwischen den Q Zellen be- 
stehen. 
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Tabelle 3.4: H ierauchische Faktoren U und V als Gliederung der P abhangi gen 
Variablen y p , welche hier an insgesamt N = N x + . . . + N 5 Beob- 
achtungseinheiten erhoben wurden. Beispiel fur Faktor U: vor- 
mittags (UJ, nachmittags (U 2 ), fur Faktor V: 5 Versuchsphasen 
(Vx bis V 5 ). Faktor V ist Faktor U hierarchisch untergeordnet 
(„genestet"), weil jede Stufe von V nur unter einer Stufe von U 
vorkommt. Das Datenschema zeigt die P = 5 abhangigen Varia- 
blen y p pro Beobachtungseinheit und deren bedingte Erwartungs- 
werte p qp . 
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Jl23 
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2 


JN.21 
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JN,23 
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Jn 2 25 




P-21 


P-22 


p23 


P24 


p25 




J 131 


J 132 


J 133 


J 134 


Jl35 


3 


JN,31 


JNj32 


JNj33 


JNj34 


JN,35 




p31 


p32 


p33 


p34 


p35 




J 141 


J 142 


J 143 


J 144 
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4 


JN,41 


JN,42 


JN,43 


JN ( 44 


Jn 4 45 




Pti 


p42 


p43 


p44 


P 4 5 




J 151 


J 132 


y 1 53 


J 1 34 


J 1 55 


5 


JN,51 


Jn^52 


JN*53 


JN 5 54 


JN S 55 
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Als zweite Hypothese prufen wir, ob sich die Erwartungswerte der abhangi- 
gen Variablen zwischen den Faktorstufen U 2 und U 2 nicht unterscheiden. 
Dazu wahlen wir C y = I, Au = 0 und 

1/3 

1/3 

(3.7.2) Ay = 1/3 . 

- 1/2 
— 1/2 _ 

Der Faktor V ist unter den Faktor U „genestet". Hypothesen uber Faktor V 
sind folglich nur auf den Stufen von Faktor U uberprufbar: 

Wir formulieren die dritte bzw. vierte Flypothese, daB sich die Erwartungs- 
werte der P abhangigen Variablen zwischen den Stufen V 2 bis V 3 auf Stufe U x 
bzw. V 4 und V 5 auf Stufe U 2 nicht unterscheiden, in der Form C B A = A, 
indem wir z.B. 

1 0 ' 

-1 1 

(3.7.3) Ayiu, = 0 — 1 

0 0 

0 o _ 

bei C V iu = 1 u n d A V iu, = 0 bzw. 

0 ' 

0 

(3.7.4) A V iu, = 0 

1 

-1 

bei C V iu = I und A V | = 0 wahlen. 

Die beiden Flypothesen uber Faktor V konnen auch gemeinsam formuliert 
und uberpruft werden. Flypothesen uber eine Interaktion UxV lassen sich bei 
einem solchen Design nicht prufen. Jedoch konnen durchaus Flypothesen 
uber die Interaktion von „abhangigen" und „unabhangigen" Faktoren gepruft 
werden (vgl. Abschnitt 3.5). 

Es sei noch bemerkt, daft die Q Zellen beliebig, d.h. kreuzfaktoriell, hierar- 
chisch Oder sonstwie, strukturiert sein konnen. Eine weitere Verallgemeine- 
rung dieses Designs liegt in der Moglichkeit, zu jeder Versuchsphase mehrere 
abhangige Variablen zugleich zu erheben, so dal$ dieser neue Faktor mit U und 
mit V gekreuzt ware. Prinzipiell lalSt sich jede Strukturierung der abhangigen 
Variablen mit jeder Strukturierung der unabhangigen Beobachtungseinheiten 
kombinieren, womit jeweils ein neues Design konstruiert ware. 
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3.8 Lateinisches Quadrat iiber den unabhangigen Variablen 

Eine weitere Moglichkeit, die unabhangigen Beobachtungseinheiten zu struk- 
turieren, ist das Prinzip des Jateinischen Quadrats". Bei diesem Designtyp hat 
man mehrere Faktoren mit gleicher Stufenzahl und P abhangige Variablen 
vorliegen, die ihrerseits durch ein beliebiges Design strukturiert sein konnen. 

Tabelle 3.5: Faktoren A, B und C im ,,lateinischen Quadrat" als Gliederung 
der Q unabhangigen Variablen x p , welche insgesamt an N = N x 
+ . . . + N 4 Beobachtungseinheiten erhoben wurden. Beispiel fur 
Faktor A: Geschlecht (A ^ 2 ), fur Faktor B: Sozialstatus (B^), 
Faktor C: Unterrichtsmethoden (C^). Das Datenschema zeigt 
die P= 4 abhangigen Variablen y p pro Beobachtungseinheit und 
deren bedingte Erwartungswerte p, qp . 



CT 
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Bei einem dreifaktoriellen Design beispielsweise, ordnet man die ersten beiden 
Faktoren A und B wie bei einem kreuzfaktoriellen Design an, und dann den 
dritten Faktor C so, dalS jede seiner Stufen jeweils nur auf einer Stufe der 
anderen beiden Faktoren vorkommt (siehe Tabelle 3.5). Bei zweistufigen Fak- 
toren fuhrt das dazu, daft man statt 2 . 2 . 2 = 8 Zellen im kreuzfaktoriellen 
Design im lateinischen Quadrat nur 2.2=4 Zellen mit Beobachtungseinhei- 
ten zu fullen hat. Der Nachteil besteht darin, daft keine Interaktionshypothe- 
sen gepruft werden konnen. 



Zu prufen ist zunachst die Hypothese, daft uberhaupt keine Unterschiede in 
den Erwartungswertevektoren der P abhangigen Variablen zwischen den vier 
Zellen bestehen. In der Form C B A = A wahlen wir dafur z.B. A abc = I, 
^a,b,c = O und 



(3.8.1) 



Ca.b.c — 



1-10 0 
0 1-10 

0 0 1-1 



Die zweite Flypothese, dalS keine Unterschiede in den Erwartungswertevekto- 
ren der P abhangigen Variablen zwischen den Stufen A 1 und A 2 bestehen, 
formulieren wir durch A a = I, A a = 0 und 

(3.8.2) C A = [1 1-1-1], 

die entsprechende Flypothese fur B x und B 2 durch A B = I, A B = 0 und 

(3.8.3) C B = [1 -1 1 -1], 

sowie fur C x und C 2 durch A c = I, A c = 0 und 

(3.8.4) C c - [1 -1 -1 1]. 



3.9 Lateinisches Quadrat iiber den abhangigen Variablen 

Auch die abhangigen Variablen konnen im Jateinischen Quadrat" strukturiert 
werden, sofern sie in mehrere Faktoren U, V und W mit gleicher Stufenzahl 
gegliedert werden konnen (siehe Tabelle 3.6). Die Okonomie des Verfahrens 
besteht darin, dalS wir bei z.B. zweistufigen Faktoren nur P = 2 . 2 = 4 
abhangige Variablen erheben mussen anstelle von P = 2 . 2 . 2 = 8 abhangigen 
Variablen im vergleichbaren kreuzfaktoriellen Design. Allerdings konnen auch 
hier (wie in Abschnitt 3.8) keine Interaktionshypothesen uber die abhangigen 
Variablen selbst gepruft werden, wohl aber uber Wechselwirkungen zwischen 
den unabhangigen und den abhangigen Variablen (vgl. Abschnitt 3.5). 
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Tabelle 3.6.: Faktoren U, V und W im ,,latei n ischen Quadrat" als Gliederung 
der P abhangigen Variablen y p , welche insgesamt an N = 
N x + . . . + N 4 Beobachtungseinheiten erhoben wurden. Beispiel 
fur Faktor U: MeBmethode 1 (U x) MeBmethode 2 (U 2 ); Faktor 
V: vormittags (Vx), nachmittags (V 2 ); Faktor W: Geschwindig- 
keit (Wx), Genauigkeit (W 2 ). Das Datenschema zeigt die P = 4 
abhangigen Variablen y p pro Beobachtungseinheit und deren be- 
dingte Erwartungswerte p qp . 
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Wir prufen zunachst die globale Hypothese, dalS in jeder Zelle die bedingten 
Erwartungswerte der P abhangigen Variablen gleich sind. In der Form C B A 
— A wahlen wir z.B. C u>ViW = i, Ay^yy^ = O und 

1 0 0 ' 

1 1 0 

0-11' 

0 0 -1 

Als zweite Hypothese prufen wir die Gleichheit der bedingten Erwartungs- 
werte der Stufen U 2 und U 2 mit 

1 

(3.9.2) Au = _J 

-1 

bei C,j = I und Ay = 0. Die entsprechenden Hypothesen fur V 2 und V 2 bzw. 
\N 1 und W 2 prufen wir mit 

1 

(3.9.3) A v = “j 

-1 

bzw. 

1 

(3.9.4) A w = “j 

1 

bei Cy — Cyy = I und Ay — Ay^ — 0. 



3.10 Zusammenfassende Bemerkungen 

In diesem dritten Abschnitt wurde die Hypothesenformulierung in verschie- 
denen Designs fur das Zellenmittelwertemodell bei gleichen Zellenfrequenzen 
behandelt. Dabei wurden exemplarisch drei Prinzipien zur Strukturierung von 
Variablen dargestellt, namlich die kreuzfaktorielle Strukturierung, die hierar- 
chische, und die nach dem Jateinischen Quadrat". Es wurde gezeigt, wie diese 
Strukturierungsgesichtspunkte sowohl fur die unabhangigen als auch fur die 
abhangigen Variablen verwendet werden konnen. Dabei wurde z.B. eine wie- 
derholt gemessene Variable formal als weitere abhangige Variable betrachtet, 
was dann angezeigt ist, wenn die Residuen der wiederholt gemessenen Varia- 
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blen zwischen den MeBpunkten nicht als unabhangig angenommen werden 
konnen (siehe Gleichung 2.3.11). 

Weiterftihrende Literatur: Zur Klassiflkation von Designs s. z.B. Bredenkamp (1980), 
Campbell und Stanley (1966) oder Kirk (1972, 1978). Winer (1971) gibt fur viele 
Designs Rechenformeln an. Andere Arten von Vergleichen Oder Kontrasten stellen fast 
alle der im Abschnitt 2 angegebenen Monographien dar, genauso wie auch andere 

Arten von Model len, dieanstelledes Zellenmittelwertemodells verwendet werden 
konnen. 



4. Parameter schatzung 



4. 1 Einleitung 



Die Parameter in der Q x P-Matrix B eines multivariaten linearen Stichproben- 
modells, welches die Gleichungen 



(4.1.1) 

(4.1.2) 



E(Y) = X B 






E, fiir n = n* 
O, fiir n n* 



n,n* e {1,2,...,N} 



erf u 1 1 1, wobei e n := y n - x n B, sowie die Parameter in der PxP-Kovarianzmatrix E 
konnen prinzipieil auf verschiedene Arten geschatzt werden. Keine der verschiede- 
nen Schatzmethoden ist fur alle Situationen optimal, und es wurde den Rahmen 
des Artikels sprengen, wenn wir versuchen wurden, alle Schatzmethoden darzu- 
stellen und kritisch zu bewerten. Statt dessen beschranken wir uns auf die Darstel- 
lung der Schatzung nach dem Kriterium der kleinsten Quadrate ohne (Abschnitt 
4.2) und mi t N ebenbedingungen (Abschnitt 4.3) sowie auf die Maximum- 
Likeli hood-Schatzung unter der Annahme, daB die e„ jeweils P-variat normal- 
verteilt sind, mit gleicher Kovarianzmatrix E n = E fur alle n e {1,2,. . . ,N} 
(Abschnitt 4.4). Die Erwartungswerte und die Kovarianzmatrix der Schatzer 
von B und V := CBA sind Gegenstand des Abschnitts 4.5, ebenso wie die 
Schatzung der Kovarianzmatrix E. AbschlieBend geben wir einige Hinweise 
auf weiterfuhrende Literatur zu anderen Schatzmethoden und einigen Proble- 
men, die in Zusammenhang mit der Parameterschatzung stehen. Die Schatz- 
theorie, die in diesem Abschnitt dargestellt wird, ist nicht auf das Zellenmittel- 
wertemodell beschrankt. Sie ist fur alle Modelle anwendbar, welche die Glei- 
chungen 4.1.1 und 4.1.2 erfullen. Darunter fallen auch Regressionsmodelle mit 
„nichtstochastischen Regressoren". 
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4.2 Kriterium der kleinsten Quadrate 

Die Standardmethode, die Parametermatrix B zu schatzen, ist, den Schatzer B 
so zu wahlen, daS die Spur der Fehlerquadratsummenmatrix 

(4.2.1) f(B) = Spur [(Y - X B)' (Y - X B)] = 

= Spur [Y'Y - 2 B'X'Y + B'X'X B] 

ein Minimum wird (vgl. z.B. Timm, 1975, S. 185). Dies erreichen wir durch 
Differenzieren der Funktion f(B) nach B (s. Bock, 1975, S. 68-69) 

«■ 

(4.2.2) d f ^ = - 2 X'Y + 2 X'X B 

d B 

(vgl. z.B. Timm, 1975, S. 100), und Nullsetzen der resultierenden Gleichung: 

,4.2.3) -±L$L . o. 

d B 

x- A 

Einen Schatzer B, der diese Bedingung erf u 1 1 1, notieren wir mit B. Die Bildung 
der zweiten Ableitung zeigt, date die Funktion f(B) an der StelleB =B tatsach- 
lich ein Minimum aufweist. 

Aus den Gleichungen 4.2.2 und 4.2.3 erhalten wir dann die sogenannte Nor- 
malglei chung 

(4.2.4) X'X B = X'Y, 

die unter der Annahme der Nonsingularitat von X'X zum Schatzer 

(4.2.5) B = (X'X)- 1 X'Y 

fuhrt. Man beachte die analogen Strukturen dieser Gleichung zu der I dentifi- 
kationsgleichung 2.2.15. 

Ist X'X jedoch singular, so kann man dennoch mit der allgemeinen Inversen 
(vgl. z.B. Rao & Mitra, 1971) (X'X) , welche die Eigenschaft X'X (X'X) X'X 
= X'X erfullt, eine Losung fur B angeben, namlich 

(4.2.6) B = (X'X)- X'Y + (I - G) Z 

wobei G = (X'X) X'X und Z eine beliebige Q x P-Matrix ist (vgl. z.B. Timm, 
1975, S. 185). Dieser Schatzer ist im allgemeinen jedoch nicht eindeutig, da 
man Z beliebig wahlen kann, d.h. es gibt unendlich viele dieser Schatzer. Erst 
wenn X'X nonsingular ist, d.h. wenn alle Spaltenvektoren von X linear unab- 
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hangig sind und damit der Rang R von X gleich der Anzahl Q der Spalten von 
X ist, wird B eindeutig, und Gleichung 4.2.5 ist mit Gleichung 4.2.6 aquiva- 
lent. Eine andere Moglichkeit, einen eindeutigen Schatzer zu erhalten, besteht 
in der Aufstellung von Nebenbedingungen (Restriktionen) uber B. 



4.3 Kriterium der kleinsten Quadrate unter Nebenbedingungen 

In vielen Fallen will man die Parametermatrix B unter bestimmten Nebenbe- 
dingungen schatzen, die man z.B. in der Form H B = 0 aufschreiben kann. 

Dabei setzen wir voraus, daR die Anzahl der Zeilen der Matrix FI gleich ihrem 
Rang ist. Solche Nebenbedingungen konnen zum einen Restriktionen sein, die 
erst die Schatzbarkeit von B ermoglichen, wie z.B. a ; = 0 in der klassischen 
Varianzanalyse. Zum anderen kann es sich aber auch um solche Restriktionen 
handeln, die aus inhaltlich theoretischen Grunden gesetzt werden, wie etwa, 
daR alle Interaktionsparameter gleich Null sind, was auch ermoglicht, daR 
Interaktions- und Fehlervarianz zu einer neuen Fehlervarianzschatzung „ge- 
poolt" werden konnen. 

Zur Minimierung der Funktion f(B) (siehe Gleichung 4.2.1) unter der Neben- 
bedingung FI B = 0 fuhrt man eine Matrix A von Lagrange-Multiplikatoren 
ein, so daR die Funktion 

(4.3. 1 g{B,A) = Spur [(Y - X B)' (Y - X B)] + 

+ 2 Spur [A' (H B - 0)] 
zu minimieren ist (vgl. z.B. Timm, 1975, S. 189). 

Wir bilden zunachst die partiellen Ableitungen (s. Bock, 1975, S. 68-69) 



(4.3.2) 


d [g(B, A)] 
d(B) 


= - 2 X'Y + 2 X'X B + 2 H'A 


und 






(4.3.3) 


d[g(B, A)] 


= H B - 0. 



d(A) 



Schatzer B und A, welche die Bedingungen 
(4.3.4) d [g(^A)] _ = Q 

d (B) 



und 
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( 4 . 3 . 5 ) 



a g(B, A) 

a (A) 



erfullen, bezeichnen wir mit Bh bzw. A H . Die zweite Ableitung zeigt, daG die 
Funktion g(B, A) an der Stellefe =B H bzw. A = A H tatsachlich ein Minimum 
aufweist. 



Aus den Gleichungen 4.3.2 bis 4.3.5 erhalten wir 

(4.3.6) X'X B h = X'Y - H'A h 
und 

(4.3.7) H B h = 0. 

Man benutzt nun die fur ein konsistentes Gleichungssystem AB = C (mit der 
Matrix B von Unbekannten) gultige allgemeine Losung 

(4.3.8) B = A C + (I - A"A)Z, 

wobei Z eine beliebige Matrix passenden Typs ist (siehe z.B. Timm 1975, 
S. 55). Auf die Gleichung 4.3.6 angewandt erhalt man daraus fur B H die Lo- 
sung 

(4.3.9) B h = (X'XyX'Y - (X'X)H'A h + [I-(X'X)-X'X] Z. 

Unter Verwendung von Gleichung 4.2.6 folgt dann 

(4.3.10) B H = B - (X'X)"H'Ah. 

Vormultiplikation mit [H (X'X) H '] _1 H und Einsetzen von Gleichung 4.3.7 
ergibt 

(4.3.11) A h = [H(X'X)-H']-‘(HB - 0). 

Aus den Gleichungen 4.3.10 und 4.3.11 erhalten wir dann 

(4.3.12) B h = B - (X'XJ-H'tHfX'XJrH'FOHfi - 0). 

Hat Gleichung 4.3.12 eine eindeutige Losung, so ist B H der Kleinste-Quadra- 
te-Schatzer fur die Parametermatrix B unter der Nebenbedingung HB = 0 
(vgl. z.B. Searle, 1971, S. 204ff. Oder Timm, 1975, S. 178). 
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4.4 Maximum-Likelihood-Kriterium 

Bei den Schatzern nach dem Kriterium der kleinsten Quadrate mussen auBer 
der Gleichheit der Kovarianzmatrizen (siehe Gleichung 4.1.2) keine Vertei- 
lungsannahmen getroffen werden, es sei denn, zum Nachweis einiger Optima- 
litatseigenschaften. 1st man jedoch zum Beispiel in der Lage anzunehmen, daB 
die Dichtefunktion der N Vektoren e n der Residualvariablen eine P-variate 
Normalverteilung mit den PxP-Kovarianzmatrizen L n = X ist, daB die e n 
stochastisch unabhangig sind, daB N > P+Q und daB der Rang R von X gleich 
Q, der Anzahl ihrer Spalten, ist, dann fuhrt die Maximierung der Likelihood- 
funktion 



L(B) = 2 re -d /2 ) pN | s | -< 1/2 > N 




1 N 

2 Z(jn - x n B)' S- 1 (y n - x n B) 

n— 1 



bezuglich B zu dem Maximum-Likelihood-Schatzer 

(4.4.1) B = (X'X)- 1 XY 

(vgl. z.B. Anderson, 1958, S. 181), der also unter den genannten Bedingungen 
mit dem Kleinste-Quadrate-Schatzer identisch ist. 



4.5 Erwartungswerte- und Kovarianzmatrix der Parameter- 
vektoren |3 p und ipk 

Wir zeigen zunachst, daB der Schatzer 

(4.5.1) B = (X'X)- 1 X'Y 

ein erwartungstreuer Schatzer von B ist: 

(4.5.2) £(B) = E [(X'X)- 1 X'Y] = (X'X)- 1 X'£( Y) = 

= (X'X)- 1 X'X B = B, 

wobei wir lediglich E(Y) = X B (siehe Gleichung 4.1.1) verwendet haben. 
Entsprechend gilt fur den Schatzer 

(4.5.3) V = CBA 

die Gleichung 

(4.5.4) £(W) = £(CBA) = CBA. 
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Die Kovarianzmatrix von einem Spaltenvektor p p der Parametermatrix B ist 

(4.5.5) C(P p ,P P ) = C[(X'X)-‘ X'y p , (X'Xr'X'jJ = 

= (X'X)- 1 X'C(y p ,y p ) X(X'X)- 1 = 

= o n p (X'X)- 1 , 

wobei y p die p-te Spalte der Matrix Y ist. Die Kovarianzmatrix C(y p ,y p ) ist 
namlich die NxN-Diagonalmatrix a p I und a p = o pp die Varianz von y p , der 
p-ten, Komponente des Vektors der abhangigen Variablen. Die Matrix 
C(P p ,P p ) wird z.B. fur die Bestimmung von Konfidenzintervallen der |3 qp be- 
notigt (siehe Abschnitt 5.6). 

Fur die Kovarianzmatrix eines Mxl-Spaltenvektors tjr k = CBa k welche z.B. 
fur die Angabe von Konfidenzintervallen bestimmter Linearkombinationen 
von B benotigt wird, gilt 

(4.5.6) C(*M> k ) = C[CBa k , CBa k ] = C C(Ba k ,Ba k ) C' = 

= C(X'X)- 1 X'[C(Ya k ,Ya k )] X (X'X)- 1 C' = 

= C(X'X)- 1 X'[V(y n a k ) IJX(X'X)- 1 C' = 

= ^(y n a k ) C(X'X)- 1 C' , 

wobei V(y n a k ) I eine NxN-Diagonalmatrix und V(y n a k ) die Varianz von y n a k 
ist, die wegen der Annahme 4.1.2 fur alle N Zeilen von Y gleich ist. Fur die N 
Varianzen V(y n a k ) gilt dabei 

(4.5.7) V(y n a k ) = C(y n a k , y n a k ) = a' k C(y n ,y n ) a k = a' k S a k . 

Die PxP-Kovarianzmatrix X kann durch die folgenden Schatzer erwartungs- 
treu geschatzt werden: 

(4.5.8) i = _ 1— (Y - X B)'(Y - X B) = 

IN ~K 

= Y'[I - X (X'X)-X'JY 



(siehe z.B. Timm, 1975, S. 186). 
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4.6 Zusammenfassende Bemerkungen 

In diesem Abschnitt wurden die Standardschatzmethoden fur die Parameter 
des Modells E(Y) = X B dargestellt. Dabei ist insbesondere die in Abschnitt 
4.3 angegebene Schatzmethode nach dem Kriterium der kleinsten Quadrate 
unter einer Nebenbedingung auch in solchen Fallen anwendbar, in denen die 
Matrix X keinen vollen Spaltenrang hat. Dies ist z.B. bei klassischen varianz- 
analytischen Modellen der Fall, bei denen man diesen „Mangel" durch Neben- 
bedingungen wie z.B. Y a \ = 0 „beheben" mulk Ein Einblick in die Komple- 

xitat des Themas ..Schatzmethoden" soil andeutungsweise in den Bemerkun- 
gen zur weiterfuhrenden Literatur vermittelt werden. 

Weiterfiihrende Literatur: Grundlage fur eine kritische Bewertung verschiedener 
Schatzmethoden sind Gtitekriterien fur Schatzer, wie Erwartungstreue, Effizienz, Ro- 
bustheit etc. Eine gut lesbare Einfiihrung ist z.B. Burkholder (1978, S. 25 Iff.). Als 
anspruchsvolle und ausfiihrliche Arbeit sei dazu Zacks (1971) genannt. Andrews et al. 
(1972) geben einen iiberblick zum Thema ,,Robustheit“. 

Andere Schatzmethoden als die hier dargestellten werden z.B. in Bandemer et al. 
(1977) dargestellt. Eine wichtige Alternative ist z.B. die verallgemeinerte Methode der 
kleinsten Quadrate, die dann angewandt werden kann, wenn die Kovarianzmatrizen 
C(y n ,y n ) nicht mehr fur alle N Beobachtungseinheiten als gleich angenommen werden 
konnen (vgl. z.B. Searle, 1971, S. 87 oder Humak, 1977, S. 30). Eine weitere wichtige 
Schatzmethode ist die Bayer-Schatzung, die vor allem dann gewinnbringend verwendet 
werden kann, wenn Vorwissen liber die Parameter besteht. Dazu verweisen wir auf 
Bandemer et al. (1977), Humak (1977), Leonhard (1975) sowie Lindley und Smith 
(1972). 

Bei der Stein’schen Schatzung besteht der Vorteil darin, daB extreme Werte („Ausrei- 
Ber“) den Schatzer weniger stark beeinflussen als beim Kriterium der kleinsten Quadra- 
te (vgl. Bandemer et al., 1977, S. Ill), was man auch mit der L p - Approximation (vgl. 
z.B. Spath, 1973, 1974) erreichen kann, bei der das Minimierungskriterium nicht unbe- 
dingt die Summe der Abweichungsquadrate (L 2 ), sondern z.B. die der absoluten Betra- 
ge der Abweichungen (L,) ist. SchlieBlich sei noch auf Harter (1974-1975) hingewie- 
sen, der eine ausfiihrliche Bibliographic liber das ,, Kriterium der kleinsten Quadrate 
und einige Alternativen“ (Ubersetzung durch die Autoren) liefert. 



5. Hypothesenbewertung 
5.1 Einleitung 

In Abschnitt 3 haben wir ausfuhrlich fur verschiedene Designs gezeigt, wie 
man Flypothesen uber die Parameter in der Matrix B des multivariaten linearen 
Stichprobenmodells 
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(5.1.1) E(Y) = XB 

formulieren kann, und zwar in der Form der allgemeinen multivariaten linea- 
ren H ypothese 

(5.1.2) H 0 : V := CBA = A 

mit der MxQ-Matrix C, der QxP-Matrix B, der PxK-Matrix A und der 
MxK-Matrix A, wobei C den Rang M ^ R und A den Rang K =S P R hat 
und R der Rang der N x Q-Matrix X ist. Dort hatten wir immer vorausgesetzt, 
daB die Parametermatrix B die bedingten Erwartungswerte der P abhangigen 
Variablen in den Q Zellen enthalt (siehe Abschnitt 3.2). Diese Voraussetzung 
brauchen wir hier nicht zu machen, d.h. die in diesem Abschnitt dargestellten 
Methoden zur Bewertung der Hypothese 5.1.2 gelten fur alle Modelle, welche 
die Gleichung 5.1.1 und 

I X, fur n = rr' 

n,tr- e {1,2,...,N}, 

O, fiir n # rr' 

erfullen, wobei e n = y n - x n B, und bei denen W := CBA schatzbar ist (vgl. 
z.B. Timm, 1975, S. 173). Auch der Abschnitt uber Parameterschatzung war 
nicht auf das Zellenmittelwertemodell beschrankt. 

Fur den multivariaten Fall wurden eine Reihe von Testkriterien vorgeschlagen, 
von denen wir die vier wichtigsten darstellen. Dabei folgen wir der Auswahl 
von Olson (1976), der auch eine ausfuhrliche Diskussion uber die Vor- und 
Nachteile der Kriterien in verschiedenen Situationen liefert (vgl. auch Stevens, 
1979). Bei den Verteilungen aller vier Testkriterien wird die P-variate Normal- 
verteilung der Zeilenvektoren y n , n e {1,2,. . . ,N}, und deren Unabhangigkeit 
voneinander (siehe Gleichung 5.1.3) vorausgesetzt, und bei alien vier Testkri- 
terien spielen die beiden Matrizen Q e und Q h eine wesentliche Rolle, die wir 
im folgenden Absatz behandeln. 

Die Matrix 

(5.1.4) Q c = (YA - XBA)'(YA - XBA) = 

= A'Y'[I - X(X'X)-X'] YA , 

die wir Fehlerquadratsummenmatrix nennen, folgt unter den oben angegebe- 
nen Voraussetzungen der zentralen K-variaten Wishart-Verteilung Wx(N-R, 
AXA') (siehe z.B. Johnson & Kotz, 1972. S. 158). 

Die Matrix 



(5.1.5) 



Q h = (CBA - A)’ [C(X'X)-C']- 1 (CBA - A), 
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die wir H ypothesenquadratsummenmatrix nennen, folgt ebenfalls der zentra- 
len K-variaten Wishart-Verteilung W K (M, ADA'), falls V=CBA=A, d.h. 
wenn die Nullhypothese richtig ist. Zur Ableitung dieser Gleichung siehe z.B. 
Timm (1975, S. 183). 



5.2 Wilks’ Lambda- Kriterium 



Unter den in Abschnitt 5.1 angegebenen Voraussetzungen folgt das Lambda- 
Kriterium von Wilks (1932) 

(5.2.1) A := ^ — - 

I Qe + Qh | 



der zentralen Wilks' Lambda-Verteilung A(K, M, N-R), falls CBA = A. 
Zum Beweis dieser Behauptung verweisen wir auf Timm (1975, S. 189ff), bei 
dem man auch eine Tabelle fur die Verteilung von A findet. 



Eine haufig anstelle von A verwendete Statistik, die auf Rao zuruckgeht (vgl. 
Rao, 1973, S. 556), ist 



(5.2.2) 



1 - A 1/a ab - 2c 
A 1/a ‘ K • M 



die unter den genannten Bedingungen approximativ der zentralen F-Vertei- 
lung folgt mit den Freiheitsgraden KM und ab-2c, wobei 



(5.2.3) 

sowie 



a = 



1 , 

I K 2 • M 2 - 4 
V K 2 +M 2 - 5 



falls K • M = 2 
, andernfalls, 



(5.2.4) 



b = N-R+M- 



K + M + 1 
2 



und 

(5.2.5) 



K • M - 2 



sind. Wenn (ab - 2c) keine ganze Zahl ist, kann man den ganzzahligen Anteil 
verwenden, um „konservativer" zu testen. 

Uber die Berechnung von A als Quotient von verallgemeinerten Varianzen, 
wesentliche Eigenschaften von A, sowie eine approximativ X-verteilte Pruf- 
statistik nach Bartlett (1947) berichtet Moosbrugger (1978, S. 114-124). 
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5.3 Roy’s Eigenwert-Kriterium 

Roy (z.B. 1957) hat den grolSten Eigenwert der Matrix (Q e + Qh)' 1 Q h , 
namlich den Wert d max , welcher die Determinantengleichung 

(5.3.1) | (Q e + Q h ) _1 Qh --911 = 0 

erf u 1 1 1 (vgl. Moosbrugger, 1978, S. 45f.), als Testkriterium fur die Nullhypo- 
these 



(5.3.2) H 0 : n(CBAv = Av) 

vorgeschlagen, die nur dann wahr ist, wenn fur jeden beliebigen K-dimensio- 
nalen Vektor v die Gleichung CBAv = Av gilt (vgl. z.B. Timm, 1975, S. 192). 

Die Verteilung dieses Testkriteriums f) max wurde von Heck (1960) und Pillai 



(1960) 


tabelliert mit den Argumenten 


(5.3.3) 


1 = min (K,M), 


(5.3.4) 


II 

1 

1 


und 




(5.3.5) 


, N-R-K-l 

b “ 2 



Dabei benutzt Pillai die Buchstaben s fur I, m fur a und n fur b. Tabellen fur 
dieses Testkriterium findet man aber auch bei Morrison (1967) und Timm 
(1975). 



5.4 Hotelling-Lawley Spur Kriterium 

Ein anderes Testkriterium, das auf Lawley (1938) und Hotelling (1951) zu- 
ruckgeht, ist 



i 

(5.4.1) U = Spur [QhQr 1 ] = £ \ , 

i— 1 

wobei I = min (K,M) und A. ; der i-te Eigenwert der Matrix QhQe" 1 ist. Pillai 
(1960) hat die zentrale Verteilung dieser Statistik abgeleitet und tabelliert, 
ebenfalls mit den Argumenten I, a und b (siehe Gleichungen 5.3.3 bis 5.3.5), 
wobei Pillai auch hier die Buchstaben s fur I, m fur a und n fur B benutzt. 
Auch bei Timm (1975) findet man eine Tabelle fur diese Statistik. 
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5.5 Pillai-Bartlett Spur Kriterium 



Ein weiteres Testkriterium, das P i llai-Bartlett-Spur-K riteriu m, ist definiert als 

i 

(5.5.1) V = I - Spur [Q e (Q h + Qe)” 1 ] = £ (1 - x,), 

i=l 

wobei I = min (K,M) und x ; der i-te Eigenwert der Matrix Q e (Qh + Q e ) _1 ist. 
Eine ausfuhrliche Tabelle dieser Statistik findet man in Mijares (1964). Weni- 
ger umfangreiche Tabellen sind in Pillai (1960), Pillai und Jayachandran (1967, 
1970), Pillai und Mijares (1959) sowie Timm (1975) abgedruckt. 



Pillai (1960, S. 19) hat auBerdem eine F-Approximation von V angegeben, 
namlich 



(5.5.2) 



(N-R-K+I) • V 
T • (I-V) 



wobei T = max (K,M). Diese Statistik ist annahernd zentral F-verteilt mit J . T 
und I . (N-R-K+I) Freiheitsgraden. 

Nach Olson (1976, S. 584) ist diese Approximation hinreichend genau und nur 
bei kleinen Freiheitsgraden leicht konservativ. 



5.6 Einfache Konfidenzintervalle 

In diesem Abschnitt werden einfache Konfidenzintervalle behandelt, im Un- 
terschied zu simultanen, uber welche z.B. Gabriel (1968, 1969 a, b) informiert. 



5.6.1 Konfidenzintervall fur einen Parameter 

Aus den in Abschnitt 5.1 aufgefuhrten Annahmen folgt, daB 

(5.6.1) ft-i r JV - _ N(0j i) 

Vv(^j 

mit Erwartungswert Null und Varianz Eins normal vertei It ist, wobei die V a- 
rianz V(|3 qp ) das q-te Element der FI auptdi agonal en der Kovarianzmatrix 

(5.6.2) C(0 p ,0 p ) = o p (X'X)- 1 

(siehe Gleichung 4.5.5) ist (vgl. z.B. Searle, 1971, S. 107). AuBerdem folgt aus 
diesen Annahmen, daB 

3qp ~ Pqp 

Vv(^ qp ) 



(5.6.3) 



~ t(N-R) 
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t-verteilt ist mit N-R Freiheitsgraden, wobei R der Rang der Matrix X ist und 
V($ qp ) der Schatzer von V(P qp ). Den Schatzer V(p qp ) erhalten wir als q-tes 
Element der Hauptdiagonalen von 

(5.6.4) C(p p ,p p ) = d 2 p (X'X)- 1 , 

wobei a p das p-te diagonale Element der Matrix £ (siehe Gleichung 4.5.8) ist. 

Ein Konfidenzintervall fur |3 qp konstruieren wir auf folgende Weise: Es sei 
± t(N-R, a/2) der untere bzw. der obere Punkt der t-Verteilung, fur welche 

(5.6.5) P[-t(N-R,a/2) < t < t(N-R, a/2)] = 1 - a 

die Wahrscheinlichkeit ist, dal5 ein t-verteilter Wert in dem angegebenen Inter- 
val! liegt. Wendet man dies auf 5.6.3 an, so erhalt man 

(5.6.6) P[-t(N-R, a/2) < < t(N-R, a/2)] = 1 - a. 

v^j 

Daraus ergeben sich die Grenzen des symmetrischen Konfidenzintervalles 

(5.6.7) P qp - t(N-R, a/2) VV((^ qp ) < |3 qp < 

< P qp + t(N-R, a/2) VV(|3 qp ) 

fur den unbekannten Parameter |3 qp , in dem der Parameter |5 qp mit Wahrschein- 
lichkeit 1 - a liegt. 

Entsprechend kann auch fur jede Linearkombi nation c'P p der Koeffizienten 
eines Vektors P p (das ist eine Spalte der Q x P-Parametermatrix B) ein Konfi- 
denzintervall angegeben werden, dessen Grenzen wir durch 

(5.6.8) c'P p ± t(N-R, a/2) • VV(c'p p ) , 
finden, wobei 

(5.6.9) \/(c'p p ) = 6 p c'(X'X)- 1 c 

(siehe Gleichung 5.6.4). 

Dabei kann c' z.B. eine Zeile der Matrix C der allgemeinen multivariaten 
linearen Hypothese H 0 : V = CBA = A sein, Oder auch eine Zeile x n in der 
Matrix X des Modells E (Y) = XB. Im letzteren Fall ergibt 5.6.8 ein 
Konfidenzintervall fur den Erwartungswert 

(5.6.10) E(y np ) = £(x n 0 p ) 

des vorhergesagten Wertes y np der Beobachtungseinheit n auf der Variablen y p . 
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5.6.2 Konfidenzintervall fur Realisationen einer abhangigen Variablen y p 

Von groBerem Interesse durfte allerdings sein, in welchem Intervall eine Reali- 
sation der Beobachtungseinheit n in der abhangigen Variablen y P liegt. Dieses 
Konfidenzintervall wird nach den folgenden Uberlegungen konstruiert. Man 
geht aus von der Differenz 

(5.6.11) Jtnp y np Jtnp ( X nPp "t" ^np)j 

welche die Varianz 

(5.6.12) V(y n? - y np ) = V(y np ) + V(e np ) 

hat, da x n P p eine Konstante und C(y np , e np ) = 0 ist. Die stochastische Variable 

(5.6.13) Jnp ~ y np ~ E(ynp~ynp) _ (Vnp ~ ^tip t(N~ R) 

^</V(y np y np ) y/V(y np -y np ) 

ist wiederum t-verteilt mit N-R Freiheitsgraden, wobei N die Anzahl der 
Beobachtungseinheiten und R der Rang der Matrix X ist. 

Analog zu dem oben fur |3 qp angestellten Uberlegungen (siehe Gleichung 5.6.7) 
erhalten wir wieder 



(5.6.14) 



P 



-t (N-R, a/2) 



< 



y np y np 

Vv(y np - Jnp ) 



+ t (N-R, a/2) 



= 1 — a. 



Daraus ergibt sich das symmetrische Konfidenzintervall 

(5.6.15) j np - t(N-R, a/2) • VV(y np - y np ) < y np < 

< y np + t(N-R, a/2) ■ VV(y np - y np ), 



in dem mit Wahrscheinlichkeit 1 - a eine Realisation von y np (ein noch unbe- 
obachteter Wert der Beobachtungseinheit n auf der p-ten abhangigen Varia- 
blen) liegt. 



Die dazu benotigte Varianzschatzung finden wir gemaB der Gleichung 5.6.12, 
wobei wir V(y np ) nach Gleichung 5.6.9 (mit c' = x,) schatzen und V(e np ) durch 
6 P , dem p-ten Element der Diagonal matrix 2 (siehe Gleichung 4.5.8), als 

V(y ap ~ Jn P ) = d P [1 + x n (X'X)- 1 x'J. 



(5.6.16) 
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5.7 Praktische Signifikanz 

Der in Abschnitt 2.2 (Gleichung 2.2.24) angegebene multivariate Determina- 
tionskoeffizient kann als praktisches SignifikanzmalS dienen und, falls C 1 = 0, 
l'A = 0' und A = 0 sind mit 1 bzw. T als „passenden" Einheitsvektoren, 
durch 

(5.7.1) = »‘ r[Q p " Qr ’ ] 

geschatzt werden, mit der Hypothesenquadratsummenmatrix 

(5.7.2) Q h = (CBA - A)' [QX'XyC'J 1 (CBA - A) 
und der Total quad ratsummenmatrix 

(5.7.3) Q t = (YA - YA)' (YA - YA) = A'Y'YA - A'Y'YA, 
wobei 

(5.7.4) Y = ill'Y 

eine NxP-Matrix ist, welche in jeder Zeile die Gesamtmittelwerte der P ab- 
hangigen Variablen uber alle N Beobachtungseinheiten als Komponenten ent- 
halt. 1 bezeichnet dabei den Einheitsspaltenvektor, der aus N Einsen besteht. 

7?h • 100% gibt bei konstant gehaltenem A = I an, wieviel Varianzprozente 
der abhangigen Variablen durch die Variationsquelle, auf welche sich die be- 
treffende Hypothese bezieht, determiniert sind. Man beachte, dalS man mit A 
I in der multivariaten allgemeinen linearen Hypothese CBA - A = 0 einen 
neuen Vektor abhangiger Variablen 

(5.7.5) w - y A 

bildet. 

5.8 Zusammenfassende Bemerkungen 

In diesem Abschnitt wurden vier Kriterien fur multivariate Signifikanztests 
dargestellt, die alle invariant bezuglich linearer Transformationen der Aus- 
gangsdaten sind. Im Gegensatz zum univariaten Fall, in dem der F-Test der 
gleichmalSig beste (uniformly most powerful) ist, gibt es im multivariaten Fall 
keine Teststatistik mit dieser Optimalitatseigenschaft. Statt dessen hangt die 
Teststarke der Kriterien davon ab, ob sich die Mittelwerteunterschiede zwi- 
schen den Gruppen auf eine Dimension konzentrieren („concentrated noncen- 
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trality structure" (Olson, 1976, S. 581)) oder ob sie liber mehrere Dimensio- 
nen der abhangigen Variablen verstreut (,, diffuse noncentrality structure”, 
ebenda) sind. Im ersten Fall ist Roys Kriterium 6 des groBten Eigenwertes 
und im letzten Fall das Pillai-Bartlett-Spur-Kriterium V die Statistik mit der 
groBten Teststarke. Flir eine ausfiihrlichere Diskussion verweisen wir auf Ol- 
son (1976) und Stevens (1979). 

Ein Signifikanztest sollte immer von der Berechnung eines MaBes der Effekt- 
groBe begleitet sein. Bredenkamp (1970) diskutiert univariate ,,MaBe der prak- 
tischen Signifikanz". Fiir den multivariaten Fall gaben wir den multivariaten 
Determinationskoeffizienten als praktisches SignifikanzmaB an, welcher auf 
den Uberlegungen von Cramer und Nicewander (1979), Shaffer und Gillo 
(1974) sowie Stevens (1972) beruht. Die erorterten Konfidenzintervalle flir die 
Modellparameter und flir pradizierte Werte der abhangigen Variablen liefern 
niitzliche Informationen zur Bemessung der statistischen Bedeutsamkeit von 
Zusammenhangen und Unterschieden, die sich in den Modellparametern (3 qp 
niederschlagen. 

Weiterfuhrende Literatur: Die multivariaten Testkriterien werden in den Standardwer- 
ken zur multivariaten Analyse dargestellt (vgl. z.B. Bock, 1975, Finn, 1974, oder 
Timm, 1975). Eine wichtige Erganzung zu Signifikanztests sind Verfahren multipier 
Vergleiche. Wir verweisen dazu auf die Monographie von Miller (1966) sowie auf 
Carmer und Swanson (1973), Einot und Gabriel (1975), Gabriel (1964, 1969a,b), Ga- 
mes (1971a,b, 1973), Petrinovich und Hardyck (1969), Ryan (1959) und Scheffe (1953). 
Ein niitzlicher Sammelband fur alle mit der Varianzanalyse zusammenhangenden Pro- 
bleme ist Krishnaiah (1980). 
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4. Kapitel 



Regressions- und kanonische Analyse 



Werner Schubo, Klaus Haagen und Walter Oberhofer 



Im Rahmen des allgemeinen linearen Modells ist das Ziel der Regressions- und 
kanonischen Analyse, Zusammenhange zwischen quantitativen Variablen zu 
beschreiben und inferenzstatistisch zu deuten. Die Regressionsanalyse be- 
schaftigt sich mit dem Zusammenhang zwischen einer einfachen Variablen und 
einer Gruppe von Variablen. Die kanonische Analyse beschreibt hingegen den 
Zusammenhang zwischen zwei Gruppen von Variablen und kann als multiva- 



Regressionsanalyse 



Kanonische Analyse 




Verallgemeinerte kanonische Analyse 




Abb. 1: DieStruktur der Beziehungen bei Regressionsanalyse, kanonischer Analyse 
und verallgemeinerter kanonischer Analyse. 
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riate Verallgemeinerung der Regressionsanalyse aufgefaBt werden. Die kano- 
nische Analyse selbst wiederum wird zur kanonischen Analyse fur mehrere 
Variablengruppen verallgemeinert (s. Abb. 1). 

Entsprechend der unterschied lichen Komplexitat einzelner Fragestellungen 
variieren auch die Anforderungen an die Einsatzbereitschaft und die mathema- 
tisch-statistischen Vorkenntnisse des Lesers betrachtlich. Da in diesem Beitrag 
eine systematische Ubersicht uber das behandelte Gebiet gegeben werden soil, 
lassen sich schwerer lesbare Passagen nicht vermeiden. Es werden hauptsach- 
lich die Voraussetzungen und Ergebnisse der statistischen Ansatze bespro- 
chen; was die mathematischen Ableitungen betrifft, begnugen wir uns mit 
Literaturhinweisen. 

Im Kap. 1 (Regressionsanalyse) wird wohl der Abschnitt 1.8 (Modelle mit 
Fehlern in den Pradiktoren) am schwierigsten sein. Die Abschnitte 1.10 (Sup- 
pression und Kol I i nearitat), 1.11 (Schrittweise Regression) und 1.12 (Teststar- 
ke) enthalten nicht nur in der Darstellung, sondern auch im Inhalt bisher nicht 
beachtete und teils auch nicht bekannte Gesichtspunkte zur Anlage und Inter- 
pretation von Regressionsanalysen; sie sind deswegen bewuBt besonders leicht 
lesbar abgefaBt. 

Das Kap. 2 (Kanonische Analyse) wird vor allem im Abschnitt 2.6 (Kanoni- 
sche Analyse fur mehrere Variablengruppen) recht komplex. Als Strategie fur 
mathematisch weniger bewanderte Leser sei vorgeschlagen, bei der ersten Lek- 
ture alle nicht unmittelbar verstand lichen Formeln zu ignorieren und nur die 
eingestreuten inhaltl ichen Betrachtungen zur Kenntnis zu nehmen. Wie auch 
in anderen Gebieten der Statistik ist bei diesen Kapiteln nicht zuletzt wegen 
des mathematischen Aufwandes ein intensives Studium erforderlich, um die 
hier dargestellten Methoden auch in der Praxis sinnvoll einsetzen zu konnen. 

Zur Notation sei angemerkt, daB Zufallsvariablen und Realisationen von Zu- 
fallsvariablen gleich bezeichnet werden, wobei aus der sprachl ichen Formulie- 
rung des zugehorigen Textes hervorgeht, was gemeint ist. Vektoren werden 
durch kleine fette Buchstaben, Matrizen durch groBe fette Buchstaben symbo- 
lisiert, wahrend skalare GroBen (Merkmale, ZufallsgroBen und Konstanten) 
im normalen, mageren Druck erscheinen. Tritt eine Matrix Oder ein Vektor als 
Index auf, so unterbleibt der Fettdruck. 



1. Regressionsanalyse 

Zunachst werde die Gliederung des Kapitels erlautert. Ausgangspunkt ist die 
beschreibende lineare Regression, die unmittelbar fur den multiplen Fall mit 
mehreren Pradiktoren formuliert wird. In Abschnitt 1.2 wird ein allgemeines 
Modell fur nichtstochastische Pradiktoren eingefuhrt, das den Rahmen fur die 
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Kapitel 1.3 bis 1.6 und 1.12 absteckt. In Kap. 1.3 und 1.4 werden beste 
Schatzungen fur unbekannte GroRen des Model Is und beste Prognosen fur 
zukunftige Werte im Kriterium angegeben. Dies umfaGt sowohl Punkt- als 
auch Bereichsschatzungen. In Kap. 1.5 stellen wir statistische Tests zur Pru- 
fung von Hypothesen uber das Modell vor. Darauf folgt ein Abschnitt, der die 
Ridge-Regression als eine Moglichkeit beschreibt, im Falle angenaherter Kolli- 
nearitat der Pradiktoren die Regressionskoeffizienten des Modells zuverlassi- 
ger zu schatzen. Wahrend Kap. 1.2 ein Modell fur nichtstochastische Pradik- 
toren enthalt, wird in Kap. 1.7 das entsprechende Modell fur Pradiktoren 
formuliert, die selbst Zufallsvariablen sind. Mit fehlerhaft gemessenen Pradik- 
toren beschaftigt sich Kap. 1.8. Als eine Anwendung des allgemeinen Ansatzes 
aus Kap. 1.2 enthalt Kap. 1.9 Hinweise auf die regressionsanalytische Behand- 
lung von Zeitreihen. Hauptsachlich praktische Probleme bei der Planung und 
Interpretation von regressionsanalytischen Studien stehen bei den drei letzten 
Abschnitten im Vordergrund. 

Die hier nicht Oder nicht ausfuhrlich behandelten Themen sollen wenigstens 
durch Literaturhinweise ersetzt werden. Dazu gehoren: 

Interpretation einer Computerprogramm-Ausgabe (Nie et al., 1975, p. 358; Gaensslen 
& Schubo, 1976, p. 319; Schuchart-Ficher et al 1980, p. 49), 

Dummy-Variablen als Pradiktoren zur regressionsanalytischen Berechnung einer Va- 
rianzanalyse (Cohen & Cohen, 1975, p. 291-424; Gaensslen & Schubo, 1976, p. 
147; Sievers, 1977), 

Behandlung von Repeated Measurement Designs (Cohen & Cohen, 1975, p. 413; 
Edwards, 1979, p. 117), 

Regression mit qualitativen und quantitativen Variablen zur Skalierung (Young et al., 
1976), 

Regression auf Polynome und trigonometrische Polynome (Cohen & Cohen, 1975, 
p.213; Graybill, 1976, p. 302), 

Nichtlineare Regression (Marquardt, 1963; Bard, 1974; Milliken & Graybill, 1970), 

Monotone Regression (Carroll & Chang, 1964; Kruskal, 1971; deLeeuw, 1977; Sulz, 
1980, p. 124), 

Missing Data-Behandlung (Timm, 1970; Losel & Wustendorfer, 1974; Cohen & 
Cohen, 1975; Frane, 1976), 

Inverse Regression und Kalibrierung (Krutchkoff, 1967; Floadley, 1970), 

Stuckweise Regression (McGee & Carleton, 1970; Wainer, 1971), 

Konfidenzbereiche fur Regressionskoeffizienten von nicht-ellipsoidischer Gestalt 
(Bowden, 1970), 

Eingeschrankter Wertebereich als Nebenbedingung an die Regressionskoeffizienten 
(Lovell & Prescott, 1970), 

Regressionsmodelle fur die Sterbetafel -Analyse (Cox, 1972), 
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Kontingenztafel analyse im linearen Modell nach Grizzle, Starner und Koch und nach 
Goodman (Kuchler, 1979, p. 154-255), 

Kovarianzstrukturanalyse und partial least squares (Joreskog, 1973, 1977, 1978; 
McDonald, 1974; Lohmoller, 1979), 

Pfadanalyse(Seibel & Nygreen, 1972; Vetter, 1972; Hummell & Ziegler, 1976) und 

Anwendung der Regressionsanalyse zur Losung des Interpretationsproblems in der 
mehrdimensionalen Skalierung und Faktorenanalyse (Gigerenzer, 1981, p. 338). 



1.1 Beschreibende lineare Regression 

Zunachst soil nur rein beschreibend die lineare Regression in einer Gesamtheit 
von Beobachtungen dargestellt werden. Es ist dabei nicht beabsichtigt, die 
Regressionsbeziehung uber die vorliegende Gesamtheit hinaus einer Grundge- 
samtheit Oder einem Modell zuzuordnen. Die hier dargestellte deskriptive 
Regression versteht sich nur als eine lineare Approximation einer Gesamtheit 
von Beobachtungen. 

Wir gehen davon aus, daB von einer Variablen y und von weiteren K Variablen 
x y x 2 , x 3 „ . „X K jeweils N Messungen vorliegen. Die Variable y nennen wir das 
Kriterium Oder auch abhangige Variable, Regressand Oder endogene Variable. 
Die Variablen x 1( x 2 , x 3l . . ,,x K werden als Pradiktoren, unabhangige Varia- 
blen, Regressoren Oder exogene Variablen bezeichnet. 

In einem Beispiel aus der Wirtschaftspsychologie konnte etwa als Kriterium y 
die Produktivitat Oder auch die Dauer des Arbeitsverhaltnisses betrachtet wer- 
den, deren Zusammenhang mit den Pradiktoren x k : Arbeitsbedingungen, Zu- 
friedenheit mit dem Vorgesetzten, Bezahlung und Vielfaltigkeit der Tatigkeits- 
bereiche untersucht werden konnte. In einem Therapieexperiment zur Reduk- 
tion des Rauchens konnten als Kriterium y der tagliche Zigarettenkonsum und 
als Pradiktoren x k die Variablen Arbeits-/ Freizeittag, AusmaB des eingesetzten 
Treatments und schlieBlich die fortlaufende Nummer des Tages dienen. Im 
letztgenannten Beispiel sind die Ergebniseinheiten Oder Merkmalstrager die 
verschiedenen Tage, an denen eine Person beobachtet wurde, wahrend im 
ersten Beispiel die Variablen jeweils an verschiedenen Beschaftigten in Form 
einer Querschnittsuntersuchung erhoben werden. 

Bei der linearen Regression ist man bestrebt, den Zusammenhang zwischen 
dem Kriterium y und den Pradiktoren X|, x 2 „ . . ,x K durch 

y = Po+PiXi + (3 2 x2+...+|3kXk 

zu beschreiben. Wenn diese Beziehung zutreffen wurde, konnte man mit ihrer 
H i Ife bei gegebenen Werten der Pradiktoren und bei Kenntnis der fur die 
Gesamtheit aller Beobachtungen konstanten Koeffizienten B 0 , B lf . . . ,B K ein- 
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deutig die Werte des Kriteriums reproduzieren. In der Empirie ist es jedoch im 
allgemeinen nicht moglich, die Werte des Kriteriums durch eine Funktion so 
einfacher Bauart zu reproduzieren. Als Ausweg bieten sich daher zwei Mog- 
lichkeiten an. Entweder man sucht eine kompliziertere Funktion, die eine 
perfekte Reproduktion ermoglicht, Oder man betrachtet die sich aus 
Po+ PiX! + . . . + (3k,x k ergebenden Werte als Approximation fur das Kriterium 
y. Wir folgen hier dem zweiten Weg und schreiben fur diese Approximation 
von y 

(1) y = p 0 +PiXi + p,x 2 +...+p K x K . 

Verwenden wir also (l) als Approximation fur das Kriterium, so ergibt sich als 

Approximationsfehler (Residuum) 

u = y-y. 

Damit laBt sich der Zusammenhang zwischen dem Kriterium y, der Approxi- 
mation y und dem Approximationsfehler u auch schreiben als 

(2) y = Po+Pix 1 +P 2 x2+...+PkXk + u. 

Die Koeffizienten |3 0 > Pi- - • • »P sollen nun so bestimmt werden, daB die Ap- 
proximation von y durch y moglichst gut ist, Oder, was dasselbe besagt, daB 
der Approximationsfehler u moglichst klein ist. Diese Aufgabe, deren Losung 
im Aufsuchen des Satzes von Koeffizienten besteht, wird in der numerischen 
Mathematik als Ausgleichung bezeichnet. Eine Voraussetzung zur Losung ist, 
daB genauer angegeben wird, was mit „moglichst kleinen Fehlern" gemeint 
sein soil. 

Man konnte etwa fordern, daB der groBte Fehler u in der betrachteten Gesamt- 
heit dem Betrage nach so klein wie moglich sein soli. Dies fuhrt zum Problem 
der Ausgleichung nach Tschebyscheff, die z.B. in Stiefel (1961, p. 47) auf 
einfache Weise beschrieben ist. Die Losung kann durch die Simplex-Methode, 
einen Algorithmus aus der linearen Programmierung, erfolgen. Dieser Ansatz 
hat den Nachteil, daB spatestens dann erhebliche Schwierigkeiten auftauchen, 
wenn inferenzstatistisch von Stichproben auf Grundgesamtheiten geschlossen 
werden soil. 

Die bislang am weitesten verbreitete und in ihren Folgen am besten untersuch- 
te Forderung ist, die Summe der quadrierten Fehler als MaB der Gute einer 
Approximation heranzuziehen. Diese Forderung wird Prinzip der kleinsten 
Quadrate Oder Minimum-Quadrat-Prinzip (MQ-Prinzip, LS-Prinzip) ge- 
nannt und soil auch hier im Vordergrund stehen. Einerseits ist sie rechentech- 
nisch leichter zu handhaben, und andererseits ist sie fur inferenzstatistische 
Schlusse besser geeignet. 
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Zur Formulierung des M inimum-Quadrat-Prinzips soli zunachst eine uber- 
sichtliche Schreibweise in Form von Vektoren und Matrizen eingefuhrt wer- 
den. Beispielsweise schreiben wir fur die Werte der Variablen y bzw. u bzw. x k 
in einer (stets als endlich angenommenen) Gesamtheit vom Umfang N 



y = 


yi 

y 2 


bzw. u = 


Ui 

u 2 


bzw. x k = 


x ik 

x 2k 




.y* 




U N 




x Nk 



Der Satz von Koeffizienten p 0 , Pi, . . .,Pk bildet den Spaltenvektor 



P = 



'00 ' 
p. 

Pk 



Fassen wir die Vektoren x k als Spalten einer Matrix auf, so erhalten wir die 
Matrix X der Pradiktorwerte 

Xll • • ■ x 1K 

X 2 1 ... X 2K 

■ • 5 

XN1 ■ • • X NK _ 



X = (x 0 , x„...,x K ) = 



Xio 

x 20 



X N0 



wobei die Variable x 0 als Multiplikator zu R 0 zugunsten einer einheitlichen 
Schreibweise eingefuhrt wurde und stets den Wert 1 hat. 



Mit dieser Schreibweise wird aus dem linearen Ansatz (2) 

(3) y = Xp + u. 

Aus (1) wird 

(4) y = X P 

Die Werte der Restvariablen u ergeben sich dementsprechend als 

(5) u = y - y = y - Xp. 

Das Prinzip der kleinsten Quadrate laRt sich nun als 

(g) S(P) = u'u = y'y - 2y'Xp + P'X'XP =Minimum 

formulieren. 

S(P) ist die Summe der quadrierten Werte der Restvariablen. Die Summe hangt 
von R ab, was durch die Angabe von R in Klammern hervorgehoben wird. 
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Naturlich hangt die Summe auch von den Werten y n fur n = 1, 2,. . „N und x nk 
fur k = 1, 2,. . ,,K und n = 1, 2,. . N in der Gesamtheit ab; diese Werte 
betrachten wir fur die M inimierungsaufgabe jedoch als fest, weshalb ihr Ein- 
fluB auf die Summe S nicht dokumentiert werden soli. 

Es laBt sich zeigen, daB notwendige und hinreichende Bedingungen fur die 
Werte des Vektors B mit minimaler Fehlerquadratsumme S(B) die sog. Nor- 
malgleichungen 

(7) X'Xp = X'y 

sind. DaB diese Normalgleichungen fur (6) notwendige Bedingungen sind, 
wird in beinahe alien einschlagigen Lehrbuchern (z.B. Johnston, 1963, p. 11, 
109; Draper & Smith, 1966, p. 10, 59; Gaensslen & Schubo, 1976, p. 299; 
Haagen & Pertler, 1976, p. 70; Hummed & Ziegler, 1976, p.40, 46; Moos- 
brugger, 1978, p. 51, 59; Edwards, 1979, p. 13, 40; Kuchler, 1979, p. 77) 
gezeigt. Eine vollstandige Darstellung erfordert aber auch den Nachweis, daB 
jede Losung von (7) auch die Minimum-Quadrat-Forderung (6) erfullt (siehe 
z.B. Schonfeld, 1969, p. 30; Wonnacott & Wonnacott, 1970, p. 13; Theil, 
1971, p. 34; Rao, 1973, p. 180; SchneeweiB, 1974, p. 43; Graybill, 1976, 
p. 174, 343; Schach & Schafer, 1978, p. 12). 

Fur die Normalgleichungen (7) gibt es stets wenigstens einen Losungsvektor, 
dessen Komponenten dann Regressionskoeffizienten heiBen. Wenn die Matrix 
X'X nichtsingular (invertierbar, von vollem Rang) ist, gibt es genau eine Lo- 
sung 

(8) P = x+ y 

mit 

X + = (X'X)->X\ 

Dies ist fur empirische Daten gewohnlich der Fall. 

Es gibt jedoch zwei Situationen, in denen die Matrix X'X im „wissenschaftli- 
chen Alltag" singular werden kann: 

1. Die Anzahl der Beobachtungen N ist zu klein; sie ist nicht groBer als die 
Anzahl der Pradiktoren K. 

2. Es besteht ein exakter I i nearer Zusammenhang eines Pradiktors mit anderen 
Pradiktoren. Wenn etwa eine gemessene Variable x k konstant ist, besteht ein 
linearer Zusammenhang zu Xq. Auch wenn x k der summative Gesamtwert 
aus den Pradiktoren x a , x 2 und x 3 ist, besteht eine derartige lineare Abhan- 
gigkeit. 

Wenn die Matrix X'X singular ist, gibt es unendlich viele Losungen der Nor- 
malgleichungen, die alle zur gleichen minimalen Quadratsumme S(B) fuhren. 
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Dies kann sich so auswirken, daB ein Oder mehrere Regressionskoeffizienten 
(Anzahl entspricht dem Rangdefekt) frei wahlbar sind; in der Regel kann 
jedoch die Vielfalt der Losungen nicht so einfach angegeben werden. Wird die 
Regressionsanalyse durch ein Computerprogramm ausgefuhrt, auBert sich die 
Singularity der Matrix durch einen Abbruch der Berechnungen mit der Feh- 
lermeldung ..Division durch Null" Oder ..Determinante ist Null", da in den 
Programmen keine Vorsorge fur eine derartige Datenkonstellation getroffen 
ist. Im allgemeinen wird man dann einige Pradiktoren ausschlieBen, um we- 
nigstens fur eine abgewandelte Regressionsaufgabe eine Losung zu erhalten. 
Spater werden wir unter den Stichwortern Kol I inearitat und Ridge-Regression 
noch auf ahnliche Situationen zuruckkommen, wo X'X nur ..beinahe" singular 
ist; ansonsten soil in Zukunft der in diesem Absatz besprochene Fall ausge- 
schlossen sein. 



Verwendet man im linearen Beschreibungsmodell (3) die Losung (8) fur B 
aufgrund der M inimum-Quadrat-Forderung (6), lassen sich eine Reihe von 
Eigenschaften der Restvariablen u ableiten, ohne daB zusatzliche Annahmen 
notwendig sind. 

So sind die Produktsummen der Residuen mit jeder Pradiktorvariablen Null 



(9) X'u =0, 

woraus sich spezieller ergibt, daB der Mittelwert der Fehlervariablen Null ist, 
und daB die empirischen Kovarianzen zwischen der Fehlervariablen und alien 
Pradiktorvariablen verschwinden: 

(10) u = 0 

( 11 ) s UXk = 0 fur alle k = 1,...,K. 

Eine weitere Folge von (9) ist 

(12) y'u = o, 

weshalb die Kovarianz zwischen der Approximation y und der Fehlervariablen 
Null ist. Weiterhin gilt die wichtige Zerlegung 



d 3 ) y'y = y'y + 

die auch in Form empirischer Varianzen geschrieben werden kann 
(14) S 2 y = S 2 y + S 2 „. 

Hieraus laBt sich die Interpretation des BestimmtheitsmaBes 




(15) 



R 2 = 



= 1 - 
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als MaB der Anpassungsgute ablesen; es liegt um so naher bei 1, je kleiner die 
Fehlerwerte sind, wahrend es sich bei groBem Fehleranteil der Zahl Null 
nahert. 

Obwohl im Rahmen der beschreibenden Regression noch eine Reihe wichtiger 
Themen wie polynomische Regression, Bedeutung einzelner Pradiktoren usw. 
besprochen werden konnte, sollen zunachst die Populationsmodelle fur infe- 
renzstatistische Aufgaben dargestellt werden, um den Zusammenhang der Ar- 
gumentation nicht durch zu viele Einzelheiten zu verwischen. 



1.2 Das allgemeine regressionsanalytische Modell 

Bei den meisten Anwendungen der Regression mochte man zu Aussagen kom- 
men, die uber die konkrete Stichprobe hinausreichen. In den anfangs erwahn- 
ten Beispielen interessiert eher der Zusammenhang zwischen der Produktivitat 
y und den Pradiktoren Arbeitsbedingungen, Zufriedenheit usw. bei zukunftig 
Beschaftigten bzw. das AusmaB des Rauchens bei zukunftiger Anwendung 
von Treatments als die Zusammenhange in der Stichprobe. Dies entspricht der 
Situation von Galileo Galilei, der 1604 sein Fallgesetz v = gs mit einem univer- 
sellen Anspruch auch fur zukunftig fallende Massen aufstellte. Die Form des 
Fallgesetzes sowie die nahere Kennzeichnung der Umstande, unter denen es 
zutreffen soil, bilden ein Populationsmodell (= Satz von Oberhypothesen) mit 
dem freien Parameter Fallbeschleunigung g, der dann durch einige Beobach- 
tungen naher eingegrenzt werden kann. Das Populationsmodell sol Ite natur- 
lich auch durch Beobachtungen begrundet und uberpruft werden. Obwohl wir 
vornehmlich Aussagen uber Parameter des Modells treffen wollen, werden wir 
auch einige Moglichkeiten zur Uberprufung des Modells kennenlernen. ubri- 
gens erwies sich auch Galileis ursprungliches Modell als revisionsbedurftig, da 
es dem spater allgemein verwendeten Fallgesetz v = gt unterlegen war. AuBer 
dem in diesem Kapitel einzufuhrenden regressionsanalytischen Modell wird in 
Kap. 1.7 noch das korrelationsanalytische Modell vorgestellt. 

Fur die Formulierung der Populationsmodelle wird auf den Begriff der Zu- 
fallsvariablen mit zugehorigen Verteilungsfunktionen (2. B. Flaagen & Pertler, 
1976, p. 169) zuruckgegriffen. Wir wollen namlich annehmen, daB die Beob- 
achtungen in Stichproben als Realisierungen von Zufallsvariablen aufgefaBt 
werden konnen. 

Das allgemeine regressionsanalytische Modell (general linear model, GLS-Mo- 
dell) umfaBt folgende Annahmen: 

(Ai) Es besteht die Beziehung 

y = XP + u, 

wobei X eine Nx(K+l)-Matrix von festen, beobachtbaren 
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Werten, B ein Vektor von festen, unbekannten Parametern mit 

K+ 1 Komponenten, 

y ein Vektor von N beobachtbaren ZufallsgroBen und 

u ein Vektor von N un beobachtbaren ZufallsgroBen sind. 

(A2) Die Matrix X ist vom Rang K + 1 

(A 3 ) Der Erwartungswert von u ist der Nullvektor: Eu = 0 

(A 4 ) Die Kovarianzmatrix E uu zu u existiert und ist nichtsingular. 

H uu laBt sich als E uu = o 2 V mit a 2 = ^ Spur £ uu darstellen. 
(A 5 ) Der Vektor u ist N-dimensional normal vertei It. 

Diese Annahmen bedurfen der Erlauterung. 

In Al wird die Art der in der Regression beteiligten GroBen und ihr Zusam- 
menhang eingefuhrt. Jede der N Zeilen von X umfaBt die K + 1 Werte der 
Pradiktorvariablen eines Merkmalstragers. Ein Merkmalstrager zur Zeile n soil 
eine Ziehung aus der Grundgesamtheit der Merkmalstrager zu den zugehori- 
gen festen Werten x n0 , x nl , . . . ,x nK der Pradiktorvariablen sein. Mit der Grund- 
gesamtheit von Merkmalstragern ist zugleich eine Wahrscheinlichkeitsvertei- 
lung der n-ten Komponente y n der Kriteriumsvariablen durch die n-te Kom- 
ponente u, der Fehlervariablen verknupft. Die Realisierungen von y n und u n 
und damit auch ihre Wahrscheinlichkeitsverteilungen unterscheiden sich nur 
additiv durch den festen Wert der n-ten Kompenente (XP) n . 

Eine wichtige Konsequenz der Annahme, daB die Werte von X fest sind, ist, 
daB sich die Interpretation der Wahrscheinlichkeiten als relative Haufigkeiten 
fur sehr groBe Anzahlen von Versuchswiederholungen auf wiederholte Zie- 
hungen zu denselben P rad iktor werten stutzt. Das bedeutet allerdings nicht, 
daB sich Inferenzen nur auf die betrachteten Pradiktorwerte beziehen konnen; 
Inferenzen sind stets in dem Bereich von Pradiktorwerten moglich, in dem die 
Model lannahmen gultig sind (Graybill, 1976, p. 147). Die Annahme fester 
Werte in X verlangt vor allem, daB die Pradiktoren fehlerfrei gemessen wer- 
den. Bei kontinuierlichen Pradiktorvariablen ist diese Forderung naturlich nie 
erfullbar, weshalb man sich dort mit der Annahme kleiner relativer MeBfehler 
zufrieden geben muB; inferenzstatistische Schlusse bleiben dann nur noch na- 
herungsweise gultig. 

Durch die Annahme A2 wird lediglich der unbequeme Fall der N icht-l dentifi- 
zierbarkeit des Vektors B ausgeschlossen. Ware X nicht vom Rang K + 1, gabe 
es beliebig viele verschiedene Vektoren B, die unter sonst gleichen Umstanden 
zu derselben Verteilung des Zufallsvektors y fuhren. A2 ist der Forderung 
gleichwertig, daB X'X nichtsingular ist. Die Forderung kann immer durch 
Umorganisation der Pradiktorvariablen und Verkleinerung ihrer Anzahl er- 
fullt werden, ohne daB der Erklarungswert der Pradiktoren geschmalert 
wurde. 
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Die Annahme A3 besagt, daB fur jede betrachtete Konstellation der Pradiktor- 
werte der Erwartungswert (Jong-run-M ittelwert") der Fehlervariablen Null 
i st, was damit gleichwertig ist, daB der Erwartungswert der Kriteriumsvaria- 
blen 

(16) Ey = Xp 

linear durch die Pradiktoren bestimmt ist. Es besteht eine Ahnlichkeit von A3 
mit der Eigenschaft (10) der M inimum-Quadrat-Methode, daB der M ittelwert 
des Approximationsfehlers verschwindet. Eine spezielle M inimum-Quadrat- 
Forderung benotigt man wegen Annahme A3 nicht. 

In Annahme A4 wird zunachst lediglich festgelegt, daB die Varianzen der 
Fehlerwerte und ihre Kovarianzen zu verschiedenen Pradiktorkombina- 
tionen existieren. Damit werden z.B. Autokorrelationen der Fehlerwerte 
cov (u n , u m ) 0 fur n + m Oder FI eterogenitat der Fehlervarianzen 
var u n # var u m fur n # m zugelassen. Weil manchmal zwar die absoluten 
GroBen der Varianzen und Kovarianzen unbekannt, aber ihre Verhaltnisse 
untereinander bekannt sind, wird meist die Kovarianzmatrix in die Faktoren 
o 2 und V zerlegt. Wir behandeln hier nur den Fall, daB V nichtsingular ist 
(sonst s. Theil, 1971, p. 274). Man fordert dann, daB die NxN-Matrix V 
bekannt sein muB, wahrend a 2 als einzelner unbekannter Parameter geschatzt 
wird. Beispielsweise wird im klassischen regressionsanalytischen Modell (ordi- 
nary least squares model, OLS-Modell), das die meisten Computerprogramme 
zur Regression voraussetzen, als Matrix V die Einheitsmatrix I vorausgesetzt: 

(K4) Euu = o 2 I> 

was Unkorreliertheit der Fehlervariablen und 
Varianzhomogenitat (Flomoskedastizitat) bedeutet. 

Das klassische regressionsanalytische Modell ist also ein Spezialfall des allge- 
meinen regressionsanalytischen Model Is. 

Die Annahme A5 schlieBlich fugt eine Voraussetzung uber die Form der Ver- 
teilung der Kriteriumsvariablen fur feste Pradiktorwerte hinzu. Diese Annah- 
me ist fur die Beurteilung der Eigenschaften der noch zu besprechenden 
Schatzfunktionen nicht erforderlich, sondern wird erst bei der Konstruktion 
von Konfidenzbereichen und statistischen Tests benotigt. Allerdings wird fur 
Schatzer nach dem Maximum-Likelihood-Prinzip (ML-Prinzip) (z.B. Schon- 
feld, 1969, p. 110; Graybill, 1976, p. 75) bereits bei der Konstruktion des 
Schatzers der Typ der Wahrscheinlichkeitsverteilung von u vorausgesetzt, wo- 
bei wir annehmen, daB die Wahrscheinlichkeitsverteilung parametrisierbar ist. 
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1.3 Die Schatzung der Parameter im allgemeinen regressionsana- 
lytischen Modell 

Wenn man weiR, daR ein allgemeines regressionsanalytisches Modell mit den 
Annahmen A I bis A4 vorliegt, und wenn eine Stichprobe vom Umfang N mit 
den Pradiktorwerten X und den Kriteriumswerten y vorliegt, dann besteht die 
Aufgabe darin, die noch unbekannten Parameter R und a 2 einzugrenzen. Die 
Matrix V aus A4 sei bekannt. Zunachst sollen Punktschatzungen und ihre 
Eigenschaften angegeben werden. 

Der beste (effiziente, kleinste Varianz) lineare erwartungstreue (kein Bias) 
Schatzer fur R, den man ohne a priori-information uber R Oder o 2 gewinnen 
kann (Seifert, 1975, p. 44), ist 

( 17 ) (X'V — 'X)— 1 X'V~ 1 y, 

der sog. GLS-Schatzer (generalized least squares estimator). Wenn dieVoraus- 
setzung der Normalverteilung A5 hinzugenommen wird, ist dieser Schatzer 
sogar in der Klasse der erwartungstreuen Schatzer (linear Oder nichtlinear) 
effizient (Theil, 1971, p. 390). Unter dieser Voraussetzung ist R zugleich auch 
der Maximum-Likelihood-Schatzer. 

Wendet man das M inimum-Quadrat-Prinzip auf die Daten der Stichprobe an, 
dann erhalt man entsprechend Gleichung (8) den sogenannten OLS-Schatzer 
(ordinary least squares estimator): 

(18) b = (X'X)->X'y, 

der unter der zusatzlichen Annahme K4 des klassischen regressionsanalyti- 
schen Modells dem GLS-Schatzer gleich ist. Auch der OLS-Schatzer ist ein 
linearer erwartungstreuer Schatzer (Johnston, 1963, p. 188), der aber nur im 
klassischen regressionsanalytischen Modell kleinste Varianz hat. Der Effi- 
zienzverlust im allgemeinen regressionsanalytischen Modell ist fur Punkt- 
schatzungen jedoch nicht groR (Wonnacott & Wonnacott, 1970, p. 334), so 
daR die Verwendung des OLS-Schatzers vertretbar scheint. 

ubrigens kann auch der GLS-Schatzer p im allgemeinen regressionsanalyti- 
schen Modell nach einem abgewandelten M inimum-Quadrat-Prinzip konstru- 
iert werden. Man erhalt ihn, indem man das Minimum von 

K K 

(y-y)'V” 1 (y-y) = I I (yk-yk) (yi~yi) (V _1 ) k i 

k=l 1 = 1 



mit y — Xp 
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fur 15 sucht. Deshalb wird der GLS-Schatzer haufig auch als WLS- Schatzer 
(weighted least squares) bezeichnet. y ist die Schatzung des Erwartungswertes 

Ey = xp. 

Ein erwartungstreuer quadratischer (z.B. Schonfeld, 1969, p. 67) Schatzer fur 
a 2 ist 

(19) o 2 = N _| c _ 1 (y-y)'V-'(y-y) 

Oder gleichwertig 

d2 = N _K_1 y^V-'-V-'XCX'V-'Xr'X'V-^y. 

Dieser Schatzer ist unter der zusatzlichen Annahme der Normalverteilung A5 
effizient in der Klasse der erwartungstreuen quadratischen Schatzer. Der ML- 
Schatzer fur o 2 weicht von (19) etwas ab, ist allerdings auch nicht erwartungs- 
treu. Im klassischen regressionsanalytischen Modell entfal It V 1 (= Einheits- 
matrix), und d 2 ist die Schatzung der Storvarianz. 

Durch erne Bereichsschatzung wird ein Bereich um die Punktschatzung ange- 
geben, der mit der Wahrscheinlichkeit l-a den zu schatzenden Parameter 
enthalt (Haagen & Seifert, 1979, p. 140). Die Wahrscheinlichkeit a, daB der 
Bereich den Parameter nicht uberdeckt, wird Irrtumswahrscheinlichkeit ge- 
nannt. Der Konfidenzbereich wird aufgrund der Werte des Zufallsvektors y 
festgelegt und ist insofern von der Realisierung der Zufallsvariablen abhangig. 
Aus der Bereichsschatzung kann auch ein statistischer Test zur Prufung einer 
Hypothese uber den Parameter abgeleitet werden. 

Zunachst sollen Bereichsschatzungen fur die Regressionskoeffizienten B einge- 
fuhrt werden. Um das Spektrum der Anwendungen zu vergroBern, wird die 
Bereichsschatzung allgemeiner fur beliebige Linearkombinationen 

(20) Y = LP 

mit fester Mx(K+l)— Matrix L 
mit M tS K+l und Rang L = M 

durchgefuhrt. Die Matrix L wird auch als Kontrast bezeichnet. Setzt man die 
Einheitsmatrix fur L ein, ist y = B. Man weiB ubrigens (Seifert, 1975, p. 57), 
daB die beste lineare erwartungstreue Schatzung von y durch 

(21) Y = LP 



aus dem GLS-Schatzer fur B berechnet werden kann. 
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Als Konfidenzbereich fur y zum Konfidenzgrad 1 — a wird der Bereich fur y 
als 

(22) 1 J~r (Y — V) (L(X'V _1 X) _1 L') _1 (y— y) ^ F a (M, N-K-l) 

konstruiert. Der angegebene Bereich ist im allgemeinen das Innere eines 
M-dimensionalen Ellipsoids mit Mittelpunkt y, fur den Fall nur einer einkom- 
ponentigen Linearkombi nation ergibt sich ein Intervall. Ein wichtiger Spezial- 
fall ist das Konfidenzintervall fur einen einzelnen Regressionskoeffizienten |3 K 
im klassischen regressionsanalytischen Modell (V = 1), das man durch den 
Ansatz L = (0,0 0,1,0 0) erhalt: 

(23) (|3k 7 2 bk)2 ^ F a (l, N-K-l) 
mit a 2 bi = o 2 [(X'X)-‘] kk ; 

die GroBe wird bei Computerprogrammen zur Regression unter dem 
Titel Standardfehler des Regressionskoeffizienten ausgedruckt. Eine Bereichs- 
schatzung fur den Parameter cr, der im klassischen Regressionsmodell die 
Varianz der Fehlervariablen u k ist, kann bei einem Signifikanzniveau von a 
durch 

(N-K-l) 6 2 ^ ^ (N-K-l) 6 2 

Xl-a/2(N— K— 1) = = X1/2(N-K-1) 

angegeben werden (SchneeweiB, 1974, p. 65, 111). 



1.4 Prognose im allgemeinen regressionsanalytischen Modell 

Im vorangehenden Kapitel hatten wir diskutiert, wie in einem bestimmten 
Modell (A1 bis A5, K4) aus den Werten einer Stichprobe die unbekannten 
Parameter der Verteilung geschatzt werden konnen. Durch die Schatzung er- 
halten wir empirische Aussagen uber den Zusammenhang von Pradiktor- und 
Kriterienwerten. Wenn Art und AusmaG des Zusammenhangs fur zukunftige 
Beobachtungen weiter gelten, konnen wir versuchen, zukunftige Werte des 
Kriteriums aus denen der Pradiktoren vorherzusagen. In dem am Anfang von 
Kap. 1.1 geschilderten Beispiel wollen wir also wissen, welchen Wert der 
Produktivitat wir fur zukunftige Beschaftigte vermuten, wenn wir ihre Ar- 
beitsbedingungen, die Zufriedenheit mit dem Vorgesetzten, die Bezahlung 
und die Vielfaltigkeit der Tatigkeitsbereiche kennen. Die so beschriebene Fra- 
gestellung der Prognose ist im Grunde ebenfalls eine Aufgabe der Schatzung, 
wobei im Gegensatz zum letzten Kapitel nicht feste Parameter einer Vertei- 
lung, sondern die Werte einer Zufallsvariablen geschatzt werden sollen. 
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Nach dem Ziel der Prognose konnen passive und aktive Prognose unterschie- 
den werden. Von der passiven Prognose soil bei einer festen, von auBen vorge- 
gebenen zukunftigen Konstellation der Pradiktoren abgeschatzt werden, wie 
die Werte des Kriteriums liegen werden. In der aktiven Prognose werden 
verschiedene alternative zukunftige Konstellationen der Pradiktoren in ihrer 
Auswirkung auf das Kriterium untersucht; das betrachtete System wird dann 
der Pradiktorkonstellation ausgesetzt, die den nach externen Beurteilungs- 
maBstaben gunstigsten Wert des Kriteriums erwarten laBt. Die aktive Progno- 
se ist etwa auf Verlaufsuntersuchungen von klinisch-psychologischen Thera- 
pien anwendbar, wo Treatments im Hinblick auf gunstigen Symptomverlauf 
ausgewahlt werden sollen. Auch bei der Auswahl von Bewerbern durch Re- 
gression wird aktive Prognose verwendet. Nur wenn die Pradiktorkonstella- 
tion nicht beeinfluBt werden kann, wenn sie etwa ihrerseits prognostiziert 
werden muB, kann nur passiv prognostiziert werden. Die darzustellenden 
Prognoseansatze sind sowohl fur aktive wie passive Prognose verwendbar. 

Zusatzlich zu den Beobachtungen der Zufallsvariablen y n fur n = 1,2, ...,N 
und der festen Variablenwerte x nk fiir n = 1,2,...,N und k = 0,1,..., K seien 
M neue Merkmalstrager mit den Werten fur die Pradikatorvariablen x nk fur 
n = N+l, N +2,...,N +M und k = 0,1, . . . ,K beobachtet, ohne daB zugleich 
die Werte der Kriteriumsvariablen bekannt waren. Die Pradiktorwerte fassen 
wir in der Mx(K+l)-Matrix X z und die zugehorigen Zufallsvariablen y n im 
Vektor y z mit M Komponenten zusammen. Die zusatzlichen Pradiktorwerte 
seien test, d.h., daB sie fehlerfrei gemessen und nicht zufallig sind. Fur viele 
Anwendungen genugt es, die Prognose nur fur einen weiteren Merkmalstrager 
(M = 1) durchzufiihren. Im allgemeinen regressionsanalytischen Modell kon- 
nen jedoch auch Zeitreihen mit voneinander abhangigen Kriteriumsvariablen 
(z.B. Korrelation von y n mit y n+1 ) behandelt werden, weshalb die Prognose 
einer Serie von unbekannten Werten wunschenswert ist. 



Fur die Prognose muB gelten, daB das allgemeine regressionsanalytische Mo- 
dell auch unter FI inzunahme von X z und y z noch gilt. Weil in den Annahmen 
Al bis A5 diese zusatzlichen Variablen nicht berucksichtigt waren, mussen wir 
sie in Form eines Prognosemodells erweitern: 

(PI) Es besteht die Beziehung 

y z = x z p+u z 

mit demselben Vektor B wie in Al. 



(y,)’ X "(x,) undu * 



u 

U z 



Dies bedeutet mit y* = 
insgesamt 

y* = X :: p+u :; - 




Regressions- und kanonische Analyse 



221 



(P2) 

(P3) 

(P4) 



(P5) 



Die Matrix X z ist vom Rang M, M ^ K+l 

Der Erwartungswert von u z ist der Nullvektor: Eu 2 = 0 

Die Kovarianzmatrix £ u , u .> zu u* existiert und ist nichtsingular. 

Zerlegung: £ u , u , = o 2 V' f = a 2 (^,y ) 

Der Vektor u z ist M -dimensional normal vertei It. 



Zuerst wollen wir uns der Prognose von 

( 24 ) ^ = Ey z > 

also der Prognose des Erwartungswertes des Kriteriums fur die zukunftigen 
Beobachtungen zuwenden. Die beste lineare erwartungstreue Punktschtitzung 
dafur ist 

( 25 ) k = xj 

mit p aus Gleichung (17) (s. Schonfeld, 1969, p. 77), wobei nur die Annahmen 
Al bis A4, PI und P3 erforderlich sind. Sind alle Annahmen Al bis A5 und PI 
bis P5 erfullt, ist eine Bereichsschatzung fur ji 2 durch 

(26) (Hz-k)'X 2 (X'V-'xr'X'^pi,-^) < F a (M, N-K-l) 



mit der Irrtumswahrscheinlichkeit a gegeben (Seifert, 1975, p. 87). 



Bestehen Zusammenhange zwischen den Fehlern u bei der ursprunglichen 
Stichprobe und den Fehlern u z bei den hinzugekommenen Erhebungseinhei- 
ten, d.h. ist die Matrix W aus Annahme P4 keine Nullmatrix, dann kann 
man aus den geschatzten Fehlern u sogar die Fehler u z schatzen, so dal5 
y z = X 15 + u z insgesamt genauer geschatzt werden kann, als dies wie in 
Gleichung (25pber eine alleinige Schatzung von 15 moglich ist. Insofern geht 
die Prognose der Zufallsgrdfie y z uber die Prognose des Erwartungswertes 
hinaus. Sind die Annahmen Al bis A4 und PI, P3 und P4 erfullt, dann ist die 
beste (im Sinne des mittleren quadratischen Prognosefehlers) erwartungswert- 
erhaltende (d.h. der Erwartungswert der Schatzung y 2 ist gleich dem Erwar- 
tungswert von y z ) linear e Punktschatzung fur y z 

{27 ) y 2 = X 2 p + W'V- 1 (y-Xp) . 

Fur diese Punktschatzung mul5 aul5er der Matrix V, die wir grundsatzlich als 
bekannt vorausgesetzt haben, auch noch die Matrix W aus P4 bekannt sein. 
Wenn wie im klassischen regressionsanalytischen Modell W = 0 gilt, fallt die 
Punktschatzung fur y z mit der fur \i z zusammen. 
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Als Bereichsschatzung fur y z wunscht man sich eigentlich einen aufgrund der 
Realisation von y konstruierten Bereich, der dann mit der Wahrscheinlich- 
keit 1 - a den Zufallsvektor y z enthalt. Das bedeutet im Jong run", daB 
(1 - a)-100%der zu prognostizierenden Werte y z in dem aufgrund der Real i- 
sierung von y konstruierten Bereich enthalten sind. Aufgrund rechnerischer 
Schwierigkeiten ist die Konstruktion solcher Bereiche im allgemeinen (wie 
auch im klassischen) regressionsanalytischen Modell noch nicht gelungen. Ein 
nicht voll befriedi gender Losungsansatz besteht in der Konstruktion von 
Toleranzintervallen und ist in SchneeweiB (1974, p. 81) skizziert. Wir wollen 
uns mit einer anderen Losung begnugen; ihre Spezialisierung auf die klassische 
Regression mit nur einer Pradiktorvariablen fuhrt zu den Vertrauensinterval- 
len fur Werte des Kriteriums, die in der elementaren Literatur (z.B. Hays, 
1963, p. 523; Gaensslen & Schubo, 1976, p. 56; Bortz, 1977, p. 231) angege- 
ben sind. 

Wir stellen uns vor, daB einer Realisation von y auch nur eine Realisation von 
y z zugeordnet wird. Die Bereichsschatzung wird so konstruiert, daB die 
Wahrscheinlichkeit dafur 1 - a ist, daB die ZufallsgroBe y z in dem durch y 
bestimmten Bereich liegt. Man stellt sich fur die long run frequency-interpre- 
tation von 1 - a also die wiederholte Realisation von y und y z vor. Wenn die 
Annahmen Al bis A5 und PI bis P5 erf u 1 1 1 sind, ist 



( 28 ) 



J^r(yz-y 2 ) ' (V z +X z (X'V-’Xrt-W'V-'W)- 1 (y z -y z ) ^ 
^ F a (M, N-K-l) 
mit X z = X Z -W'V-'X 



eine Bereichsschatzung fur y z (s. Theil, 1971, p. 288) zur Irrtumswahrschein- 
lichkeit a. Zur Berechnung dieser Bereichsschatzung ist die Kenntnis der gan- 
zen Matrix V* aus P4 erforderlich, also die Kenntnis von V, W und V z . 



Im klassischen regressionsanalytischen Modell (Unabhangigkeit aller Fehler- 
variablen aus u*) wird V = I, W =0 und V z = I vorausgesetzt, wodurch sich 
(28) zur Bereichsschatzung 



(29) j^i(yz-y z ) ' (I+X 2 (X'X)- X')- 1 (y z - y z ) ^ F a (M, N-K-l) 

vereinfacht. Bei weiterer Vereinfachung auf eine Pradiktorvariable x (K = 1) 
und eine zusatzliche Erhebungseinheit (M = 1) erhalt man die bekannte ein- 
fachste Bereichsschatzung fur die skalare Zufallsvariable y z 



(30) 




1 + 



x z - 2x z x + x 2 
N (x 2 - 5 2 ) 



^ F a (l,N— 2). 
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1.5 Statistische Tests im klassischen regressionsanalytischen 
Modell 

In den beiden letzten Kapiteln haben wir im Rahmen eines Modells uber den 
funktionalen Zusammenhang versucht, Parameter Oder von diesen abhangige 
ZufallsgroBen zu schatzen. Insofern war die Aufgabe die „Quantifizierung 
einer Theorie". Jetzt wollen wir uns der Frage zuwenden, ob unsere Annah- 
men im Widerspruch zu den Beobachtungen stehen. Die neue Aufgabe ist also 
die „empirische Uberprufung einer Theorie" (Seifert, 1975, p. 130). Dabei ist 
es haufig unmoglich, aus den Beobachtungen abzulesen, welche spezielle An- 
nahme nicht zutrifft, weil der Widerspruch in der Regel nur innerhalb eines 
ganzen Satzes von Annahmen (Hypothesen und Oberhypothesen) hergestellt 
werden kann. Man muB dann nach dem AusschluBverfahren der Reihe nach 
alle Annahmen bis auf eine von ihnen als Quelle des Widerspruchs aus- 
schlieBen. 

Eine Ubersicht uber die Theorie der statistischen Tests wird in diesem Hand- 
buchband von Wendt gegeben. Doch wollen wir hier die Nomenklatur der 
statistischen Tests (s. auch Haagen & Seifert, 1979, Teil III) prazisieren. Unter 
einem Signifikanztest verstehen wir die Konstruktion eines kritischen Bereichs 
derart, daB fur alle Parameter aus der Nullhypothese die Wahrscheinlichkeit 
dafur a ist, daB die PrufgroBe in den kritischen Bereich fallt. Die Entschei- 
dungsregel ist: Fallt die Realisation der PrufgroBe in den kritischen Bereich, 
verwerfen wir die Nullhypothese; sonst enthalten wir uns des Urteils. Im 
Neyman-Pearson-Test (NP-Test) wird der kritische Bereich so konstruiert, 
daB die Wahrscheinlichkeit dafur, dafi die Priifgrofie fiir alle Parameter aus der 
Nullhypothese einen Wert in diesem Bereich annimmt, a ist, und moglichst 
so, daB sie fur alle Parameter aus der Alternativhypothese maximal ist; gelingt 
dies, nennt man den Test einen gleichmaBig machtigsten Test (UMP-Test). Bei 
sog. zweiseitigen Alternativhypothesen gibt es keinen gleichmaBig machtig- 
sten Test; wenn man vom kritischen Bereich jedoch fordert, daB die Wahr- 
scheinlichkeit dafur, daB die PrufgroBe fur die Parameter der Alternativhypo- 
these einen Wert in diesem Bereich annimmt, stets mindestens a ist, existiert 
auch dann ein gleichmaBig machtigster Test, den man einen gleichmaBig mach- 
tigsten unverfalschten Test (UM PU-Test) nennt. Beim Likelihood-Quotien- 
ten-Test (LQ-Test) wird als PrufgroBe der Likelihood-Quotient verwendet, 
der Quotient der maximalen Likelihood aus der Nullhypothese und der maxi- 
malen Likelihood aus der Alternativhypothese. Als kritischer Bereich wird ein 
I nterval I zwischen 0 und dem kritischen LQ gewahlt. Sowohl beim NP-Test 
als auch beim LQ-Test entscheidet man sich fur die Nullhypothese, wenn die 
PrufgroBe nicht in den kritischen Bereich fallt. 

Aus Bereichsschatzungen zu einem evtl. vektoriellen Parameter 0 kann immer 
zumindest ein Signifikanztest konstruiert werden, wenn die Nullhypothese im 
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zu schatzenden Parameter einfach ist. Hat die Bereichsschatzung zum Signifi- 
kanzniveau a die Gestalt f(0,y) ^ g a und spezifiziert die Nullhypothese den 
Parameter 0 =0 (O) , dann weiB man, daB f(0 (o) ,y) 5? g a mit Wahrscheinlichkeit 
1 -a gilt, wenn die Nullhypothese zutrifft. Als PrufgroBe kann daher f(0 iO) ,y) 
verwendet werden; ist ihre Realisation f(0 (o) ,y) > g, entscheidet man sich 
gegen 0 (O) und damit gegen die Nullhypothese. Da die Tests fur das allgemeine 
regressionsanalytische Modell durch die beschriebenen Bereichsschatzungen 
bereits explizit gegeben sind, werden hier die entsprechenden Tests fur das 
klassische regressionsanalytische Modell mit Normalverteilungsannahme A5 
angegeben. 

Zur Uberprufung von Hypothesen tiber die Regressionskoeffizienten verwen- 
den wir wieder die Linearkombination y = LP aus Gleichung (20) mit der 
Mx(K+l)-Kontrastmatrix L. Die Nullhypothese sei y = y (0) , die Alternativ- 
hypothese y =Ay (0) , Die Nullhypothese wird verworfen, wenn 

(31) (Y (0) - Y )' (L(X'X)-’L')- 1 (y (0) - Y) > F„(M,N-K-1) 

mit y = L(X'X) _1 X'y 

undo 2 = N _^ y' (I - X (X'X) _1 X')y 

ist. Dies ist auch gleichwertig dem LQ-Test und fur M =1 (nur eine skalare 
Linearkombination) ein gleichmaBig machtigster unverfalschter NP-Test, 
wenn in der Entscheidungsregel die Entscheidung H 0 bei in Gleichung 
(31) einbezogen wird. Fur M > 1 existiert kein gleichmaBig machtigster unver- 
falschter NP-Test (Kendall & Stuart, 1976, p. 238). Wenn als Kontrastmatrix 
L die Einheitsmatrix verwendet wird, kommt man zum Test der Regressions- 
koeffizienten. Bei der speziellen Nullhypothese P <0) = 0 erhalt man mit dem 
aus Gleichung (15) ubernommenen BestimmtheitsmaG (Quadrat der empiri- 
schen multiplen Korrelation) 

s 2 ; _ y' y - Ny 2 _ y'XCX'X^X'y - Ny 2 
s 2 y y'y - Ny 2 y'y - Ny 2 

die Entscheidungsregel, daB die Nullhypothese verworfen wird, wenn 
(N-K-l) (r 2 + 4) 

(33) (K+l) ' (l-R 2 ) S/ > W+1.N-K-!). 

Dieser Test wird in der Regel nur sinnvoll sein, wenn sowohl die Pradiktorva- 
riablen als auch die Kriteriumsvariable auf Verhaltnisskalen (z.B. Gigerenzer, 
1981, p. 116) gemessen sind, weil nur dann die Komponente p 0 des Vektors 



(32) R 2 = 
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(der Achsenabschnitt der Regressionsflache) in alien zulassigen Skalierungen 
der Variablen zugleich den Wert Null hat. Beschrankt man die Nullhypothese 
auf die ,,echten" Regressionskoeffizienten (3/ 0) = p 2 (0) = . . . = (3 K (0) = 0 und 
laRt das Absolutglied |3 0 (0) (wie stets auch a 2 ) often, erhalt man aus Gleichung 
(31) mit einer geeigneten Matrix L die bekannte Entscheidungsregel zum Ver- 
werfen der Nullhypothese: 



(34) 



(N-K-l)R 2 
K (1-R 2 ) 



> F a (K,N— K— 1) 



(Cooley & Lohnes, 1971, p. 51; Kerlinger & Pednazur, 1973, p. 63; Cohen & 
Cohen, 1975, p. 104; Gaensslen & Schubo, 1976, p. 108; Bortz, 1977, p. 592; 
Moosbrugger, 1978, p. 70; Kuchler, 1979, p. 127). Mit diesem Test kann also 
uber die Frage entschieden werden, ob wenigstens eine der Pradiktorvariablen 
X|,. . . ,x K einen von Null verschiedenen Regressionskoeffizienten hat, ob also 
insgesamt ein Zusammenhang zwischen Kriterium und Pradiktoren besteht. 

Bei der Prufung der Frage nach der Relevanz einzelner Pradiktorvariablen x k 
ist der schwerwiegendere Fehler, wenn eine bedeutsame Variable vergessen 
wird, als wenn eine Variable mit (3 k = 0 uberflussigerweise aufgenommen 
wird. Denn das Vergessen einer bedeutsamen Variablen ist ein Spezifikations- 
fehler in Al, der zur Folge haben kann, daR die Schatzung der Regressionsko- 
effizienten zu den ubrigen Variablen nicht erwartungstreu ist, sowie daR sonst 
vermeidbare Fleteroskedastizitat, Autokorrelation Oder Strukturbruch auftre- 
ten. Daher ware der Signifikanztest der Nullhypothese (3^ 0) 0 angemessen; 

ein derartiger Signifikanztest bereitet jedoch erhebliche theoretische Schwie- 
rigkeiten und kann hochstens fur feste Werte, z.B. |3^ 0) = -0.5, durchgefuhrt 
werden. Man begnugt sich in der Regel mit der Prufung der Nullhypothese (3^ 
= 0, wodurch nur das Signifikanzniveau a fur den weniger gravierenden Feh- 
ler kontrolliert wird. Entsprechend der Bereichsschatzung (23) kommt man 
zur Entscheidungsregel, da8 die Nullhypothese abgelehnt wird, wenn 

(35) -|r- >F a (l,N-K-l) 

°b k 

ist. Auch dieser Test kann durch entsprechende Korrelationskoeffizienten aus- 
gedruckt werden. Dazu muR aber noch die empirische semipartielle Korrela- 
tion (vgl. Gaensslen & Schubo, 1976, p. 87) 



(36) 



1 y(k-12..4-..K) 



= b k 




1 - R 2 
(N-K-l) 



eingefuhrt werden. Man erhalt dann dieselbe Entscheidungsregel wie bei (35) 
mit 



(N-K-l)r 2 (k _ 12 .4... K) 



(37) 



1 - R 2 



> F a (l, N-K-l). 
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Weil hier nur ein Regressionskoeffizient gepruft wird, ist der Test als NP-Test 
ein gleichmaBig machtigster unverfalschter Test. Einen gleichmaBig machtig- 
sten Test fur die einseitige Alternativhypothese p k > 0 erhalt man durch 

—^== > V F 2o (l,N— K— 1) = t 0 (N-K-l). 



Als Beispiel fur die Anwendung einer Kontrastmatrix soil der Test auf Struk- 
turbruch vorgestellt werden. Unter Strukturbruch versteht man eine Verlet- 
zung des klassischen regressionsanalytischen Model Is derart, daft entweder die 
Regressionskoeffizienten B Oder die Fehlervarianz o 2 zu den ersten N x Beob- 
achtungen einen anderen Wert haben als die zu den zweiten N 2 = N— N, 
Beobachtungen. Das Problem und dessen Behandlung werden unter dem 
Stichwort ,,differentielle Prognostizierbarkeit“ angesprochen (z.B. Moosbrug- 
ger, 1980b). Wenn der Strukturbruch erkannt ist, mussen entweder in den 
beiden Gruppen getrennte Model le aufgestellt werden Oder man muB das Re- 
gressionsmodell um sog. Interaktionen erweitern. Fur den Test auf Struktur- 
bruch der Fehlervarianz werden wir das erste Vorgehen wahlen, das zweite 
Vorgehen wahlen wir fur den Test auf Strukturbruch in den Regressionskoeffi- 
zienten. Flier soil zunachst der Strukturbruch in den Regressionskoeffizienten 
getestet werden. Fur die Darstellung beschranken wir uns auf die Einfachre- 
gression K = 1 mit B' = ((3 0 , Pt). p o ist der Koeffizient zur Konstante = 1, 
P! der zu x, n = x n . 

Die Regressionskoeffizienten in der 1. Beobachtungsgruppe seien pV\ die 
in der zweiten Beobachtungsgruppe pk 2) , pf } . Die Fehlervarianz sei in beiden 
Gruppen einheitlich a 2 . Um den Test (31) anwenden zu konnen, muB das 
Modell auf 4 Regressionskoeffizienten, d.h. auch auf 4 Pradiktoren erweitert 
werden: 

(38) y n = P? } W + Pi 1J 8d>x n + p?> 8W + PP 6< 2 )x n + u n 



mit den „Dummyvariablen" 



... f 1 falls Beobachtung n zur Gruppe i gehort 
(39) \ 0 sonst. 



Dadurch, daB nun insgesamt 4 Pradiktoren vorliegen, von denen fur jede 
Gruppe jeweils zwei konstant den Wert Null haben, liegen in einer Regres- 
sionsgleichung zwei verschiedene Regressionsansatze vor. Obwohl wegen des 
schwerwiegenderen Fehlers, den Strukturbruch zu ubersehen, eigentlich die 
gegensatzliche Flypothesenstellung angemessen ware, wahlt man wegen der 
erwahnten Schwierigkeiten als Nullhypothese 



P^ = pf?) und P^ = PP 



Y 



_m i) -pe )> i _ 
~ V pv» - p ?> ~ 




(40) 

Oder 
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Die Kontrastmatrix L ist demnach 



(41) 




womit die Prufung nach (31) erfolgen kann. Praktisch wird dies nur moglich 
sein, wenn ein Computerprogramm zum Linearen Modell vorliegt. Fur Com- 
puterprogramme zur Regressionsanalyse ist der Test fur den zusatzlichen Bei- 
trag von Variablengruppen nach Kap. ill fur den folgenden gleichwertigen 
Model lansatz gunstiger 



(42) 



Y n - Po + Pix n + p, (bP - dP) + p 3 (b^ - bP)x n + u n 



wobei der Zusammenhang zu den Regressionskoeffizienten aus dem Ansatz 
(38) durch 



(43) 



Po = (ft 0 + P8°)/2 
Pi = (P^ + Pi 2) )/2 
p 2 = (p^ - m/2 
p 3 = (p^ - m /2 



gegeben ist. Die N ullhypothese (40) lautet in dieser Parametrisierung jetzt 
einfacher 



(44) 



P2 == P 3 = 0 



und kann als Test direkt zu den Regressionskoeffizienten praktisch leichter 
durchgefuhrt werden. Eine derartige Reparametrisierung ist bei jeder Kon- 
trastmatrix L moglich, wobei lediglich die Pradiktorvariablen entsprechend 
transformiert werden mussen. 



Der Test auf Strukturbruch der Fehlervarianz pruft, ob die Fehlervarianzen 
of,) und 0 ( 2 ) zu den beiden Beobachtungsgruppen gleich sind. Insofern handelt 
es sich um eine einfachste Form der Prufung auf Varianzheterogenitat (Hete- 
roskedastizitat); differenziertere, kompliziertere und auch nur asymptotisch 
gultige Tests hierzu sind z.B. in Ramsey (1969), Kmenta (1971, p. 269) und 
Gartside (1972) beschrieben. Wie angekundigt stellen wir zwei getrennte Re- 
gressionsansatze in den beiden Beobachtungsgruppen auf; dadurch wird auch 
zugelassen, daR zugleich Strukturbruch in den Regressionskoeffizienten be- 
steht. Aufgrund der beiden Teilstichproben vom Umfang N x und N 2 bildet 
man Schatzungen der Fehlervarianzen of,) und bf 2) . Fur die einseitige Fragestel- 
lung mit der Alternativhypothese of,) <of 2) erhalt man mit der Entscheidungs- 
regel 

5^ < F,_ a (N, — K— 1, N 2 — K— 1) = 

°( 2 ) 



(45) 



F a (N 2 — K— 1, N, — K— 1) 
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fur die Alternativhypothese einen gleichmalSig machtigsten NP-Test zum Ni- 
veau a. Bei ungerichteter Alternativhypothese of^ ¥= af 2 ) i st wegen der Asym- 
metrie der F-Verteilung folgender zweiseitiger Test mit jeweils gleichen Irr- 
tumswahrscheinlichkeiten ein nur naherungsweise gleichmaGig machtigster 
unverfalschter NP-Test: Verwirf die Nullhypothese zugunsten der Alternativ- 
hypothese, wenn 

(46) < F i — a /2 (N,-K-1,N 2 -K-1) Oder 

0 ( 2 ) 

-%p- > V an (Nj-K-1, N 2 -K-l). 

°(2) 

Besonders schwierig zu interpretieren sind Prognosetests, weil durch sie die 
Nullhypothese „der ganze Satz von Annahmen A1 bis A5 und PI bis P5 trifft 
zu" gepruft wird. Wird durch den Test die Nullhypothese verworfen, muR 
durch das Vorwissen eingegrenzt werden, welche der Annahmen speziell frag- 
wurdig ist, ob etwa ein Strukturbruch bei der Erhebung der zusatzlichen 
Beobachtungseinheiten vorliegt, ob ein Modellfehler in Form eines vergesse- 
nen Pradiktors vorliegt Oder die Normverteilungsannahme verletzt ist (oder im 
allgemeinen regressionsanalytischen Modell die Matrix V falsch spezifiziert 
wurde). Dennoch hat der Prognosetest fur die Beurteilung einer Regressions- 
beziehung als ganzes seine unbestrittene Bedeutung; er ist fur Kreuzvalidie- 
rungsstucLien der Test der Wahl. Weil die Anwendung der Bereichsschatzung 
(28) fur den Prognosetest im allgemeinen regressionsanalytischen Modell al- 
lenfalls rechnerische Schwierigkeiten mit sich bringt, wird auch hier wie uber- 
all in diesem Kapitel 1.5 nur die Spezialisierung auf das klassische regressions- 
analytische Modell dargestellt. Gegenuber der Anwendung der Bereichsschat- 
zung (29) als Signifikanztest kann ein etwas vereinfachter Test dadurch erreicht 
werden, dalS die Pradiktoren in der Matrix X „ortho-standardisiert" werden; 
dies kann z.B. durch eine Flauptkomponentenanalyse mit Bildung von stan- 
dardisierten Flauptkomponentenwerten geschehen, wobei die Konstante x 0 = 1 
nicht transformiert werden muR. Fur derartige Pradiktoren gilt 

(47 ) X'X = N I , 

womit der Prognosetest durch die Entscheidungsregel zur Verwerfung der 
N ullhypothese 

(48) (y t - %)' ( 1 +^ X 2 X' 2 )“ 1 (y 2 - y 2 ) >F a (M.N-K-l) 

gegeben ist. Dabei ist 6 2 die Schatzung der Fehlervarianz aus der ursprungli- 
chen Stichprobe und M die Anzahl der Beobachtungseinheiten in der zusatzli- 
chen Stichprobe. Die Schwierigkeit bei dieser Entscheidungsregel ist, dalS sie 
mit den ublichen Computerprogramm nicht auszuwerten ist. Doch kann man 
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fur die linke Seite der Ungleichung (48) eine obere und untere Schranke ange- 
ben, deren Komponenten z.B. mit dem Statistik-Programmsystem SPSS (Nie 
et al„ 1975; Beutel et al„ 1980) bestimmt werden konnen. Wenn (47) nach wie 
vor erf u 1 1 1 ist, gilt mit 

N+M 

hob = £ ( y n - y n ) 2 und 

n=N+ 1 

(49) 

N+M i K N+M 

hunt = £ (y n - y n ) 2 - jq- £ (£ (y n - ynXO 2 

n=N+l k=0 n— N+ 1 

die Ungleichung 

hunt ^ (Yz - VzY (I X 2 X' 2 )-> (y 2 - y z ) ^ h ob . 

Mit diesen GroBen kommen wir zur Entscheidungsregel: 

Fur 

— > F a (M,N— K— 1): Entscheidung fiir H t 

(50) 

2 - < F a (M,N— K— 1): Entscheidung fiir H 0 

sonst: keine Entscheidung Oder Ruckgriff auf (48). 

Der Durbin- Watson-Test auf Verletzung der Annahme des klassischen regres- 
sionsanalytischen Modells, daG die Fehlervariablen unkorreliert sind, wird in 
Kapitel 1.9 besprochen. Die Normalverteilungsannahme verbleibt schlieBlich 
als eine schwer uberprufbare Annahme. Im Modell-Ansatz verlangt A5, daG 
die Fehler u n multivariat normal vertei It sind. Dafur genugt es nicht, daR jede 
Fehlervariable u n fur sich normal vertei It ist, wenn nicht zusatzlich uber K4 
hinaus die Unabhangigkeit dieser Fehlervariablen angenommen werden kann. 
Es ist wegen des zentralen Grenzwertansatzes richtig, daR die Fehler dann mit 
guter Naherung als multivariat normal vertei It betrachtet werden konnen, 
wenn sie additiv auf viele, unabhangige EinfluGfaktoren zuruckgehen. Doch 
niemand kann letztlich ausschlieRen, daB der Fehler fast ausschlieBlich auf eine 
im M odell nicht berucksichtigte, nicht normal verteilte Variable zuruckgeht. 
Draper & Smith (1966, p. 87) diskutieren einige Moglichkeiten der grafischen 
Beurteilung der Normalverteilungsannahme, die sich auf die empirische Ver- 
teilung der N geschatzten Residuen stutzen. Eine einfache Methode zur Beur- 
teilung der univariaten Normalitat, die vor allem auf AusreiGer in der empiri- 
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schen Verteilung der Residuen empfindlich ist, besteht darin, nachzuprufen, 
ob im Bereich 

[-V6 5 t a/2 (N— K— 1), +V6 5 t a/2 (N— K— 1)] 

auch wirklich der Anteil l - a der Residuen liegt. In Tests zur Normalvertei- 
lungsannahme fuhren Lienert (1967, p. 172) und Koerts & Abrahamse (1969, 
Kap. 7) ein. Uber die Robustheit der Bereichsschatzungen und Signifikanz- 
tests gegenuber Abweichungen von der Normal verteilung findet man in Ma- 
linvaud (1966, p. 297) Hinweise. 



1.6 Ridge-Regression 

Wir betrachten das klassische Regressionsmodell y = xp + u, bei dem die 
Annahmen Al, A2, A3 und K4 erf u 1 1 1 sind, so daft die Fehler u k unkorreliert 
sind und gleiche Varianz haben. Es sollen nun genauer die Eigenschaften des 
M inimum-Quadrat-Schatzers 

b = (X’X) _1 X’y 

untersucht werden. Im Zusammenhang mit Gl. (18) war berichtet worden, 
daB b der beste lineare erwartungstreue Schatzer ist. Diese Aussage des Satzes 
von GauB-Markov bedeutet, daB fur al le Linearkombinationen l’b mit festem, 
beliebigem Gewichtevektor I die Varianz kleiner ist als fur die mit irgendeinem 
anderen linearen erwartungstreuen Schatzer B gebildete Li nearkombi nation 

!'P = 

var (l'b) ^ var (l'P) 

fur beliebige I und al le linearen erwartungstreuen Schatzer p. Setzt man fur I 
den Einsvektor j ein, erhalt man als Varianz 



( 51 ) 



K 

var (j'b) = E (b - P)'(b - P) = E X ( b k _ Pk) 2 

k=0 



den Erwartungswert der Summe der quadrierten Schatzfehler, den man auch 
den mittleren quadratischen Fehler (mean square error) nennt. Dieser mittlere 
quadratische Fehler ist fur den M inimum-Quadrat- Schatzer b also minimal 
unter den linearen und erwartungstreuen Schatzern. Dieser Fehler wird sehr 
groB, wenn die Pradiktoren angenahert kollinear sind, wie sich aus den folgen- 
den Uberlegungen ergibt. 

Fur die Kovarianzmatrix von b ergibt sich 

E bb = o 2 (X'X)- 1 . 



( 52 ) 
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Nach Definition der Kovarianzmatrix gilt 

(53) E bb' = PP' + £ bb 
und damit gemaB (52) 

(54) E bb' = PP' + o 2 (X'X) 1 . 

Daraus ergibt sich weiter 

(55) E Z bj = Spur (E bb') = Z Pk + o 2 Spur (X'X)- 1 . 

k k 

Bezeichnen wir mit , . . . ,X K die Eigenwerte von X'X, dann ergibt sich 
aus (55) 

(56) E Z b k = Z Pk + o 2 Z (lA-k). 

k k k 

Aus (56) ist ersichtlich, daB der Erwartungswert der Summe der Quadrate der 
b k um so mehr von der Summe der Quadrate der p k abweicht, je kleinere 
Eigenwerte von X'X auftreten. Wenn aber die Pradikatoren fast kollinear sind, 
so ist mindestens ein Eigenwert von X'X relativ klein. Dementsprechend wird 
auch der mittlere quadratische Fehler 

(57) E Y. (k - Pk) 2 = o 2 Z ( 17 ^k) 

k k 

relativ groB, so daB sich im Fall angenaherter Kol I i nearitat sehr ungenaue 
Schatzungen ergeben. Die Ungenauigkeit der Schatzungen beruht letztlich auf 
mangelnder Information und konnte nur durch zusatzliche a priori Informa- 
tion kompensiert werden. 

Um nun zu verhindern, daB die erwartete Quadratsumme der Schatzungen zu 
groB wird (siehe (56)), werden die p k nach der Minimum-Quadrat-Methode 
durch einen Vektor B unter der folgenden Nebenbedingung 

(58) Z Pk = c 

k 

geschatzt. Mit H i Ife des Lagrange-A nsatzes ergibt sich das Minimierungspro- 
blem 

(59) (y - XP)'(y - Xp) + h P'p =Minimum, 

wobei h der Lagrange-Multiplikator ist. Daraus resultieren die Normalglei- 
chungen 

(60) X'Xp + hp = X'y 

bzw. die fur h ^ 0 stets existierende Losung 

(61) P = (X'X + hir'X'y. 
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Man konnte nun wegen (58) h durch c ausdrucken und als Funktion von c 
ersetzen. Da dieser ErsetzungsprozeB nur implizit moglich ist, parametrisieren 
wir 8 durch h, d.h. fur jedes h wird vermoge (61) ein Schatzer festgelegt. 
Speziell resultiert fur h = 0 der gewohnliche Minimum-Quadrat- Schatzer. Der 
Schatzer 8 hei I5t Ridge-Regression-Schatzer (R.R.-Schatzer). 

Es gibt noch eine Verallgemeinerung, die sogenannte general i si erte Ridge- 
Regression-Schatzung (G. R.R.-Schatzer), bei der das Vielfache der Einheits- 
matrix in (61) durch eine Diagonal matrix H ersetzt wird 

(62 ) P - (X'X + H)-‘X'y. 

Im folgenden wird nur die R.R.-Schatzung betrachtet. Zuerst wird gezeigt, 
dal$ der R.R.-Schatzer verzerrt ist. Es gilt namlich 

(63) E p = (X'X + hl)-'X'(Xp) = p - h(X'X + hi) 1 p. 

Also ergibt sich die Verzerrung 

(64) E(P) - P = - h(X'X + hl)-'p. 
die von B abhangt. 

Der Vorteil des R.R.-Schatzers ist, daB es ein h gibt, so daB der mittlere 
quadratische Fehler E(P~P)'(P-P) kleiner ist als der des gewohnlichen M ini- 
mu m-Q u ad rat- Schatzers E(b-P)'(b-P), wie H oerl & Kennard (1970) gezeigt 
haben. Von Theobald (1974) wurde gezeigt, daB fur 



<h<h max = 



— — - und alle positiv definiten 
** ** Matrizen W gilt 



(65) E (P - p)'W(P - P) < E (b - p)'W(b - P). 

Wird speziell W = I gewahlt, so ergibt sich eine Aussage, die der von Floerl & 
Kennard (1970) entspricht. Da aber h max von den unbekannten |3 k abhangt, hat 
die Aussage (65) nur geringe praktische Bedeutung. 



Es gibt auch Versuche, h max , und damit h, in Abhangigkeit von y und X zu 
schatzen. Dann werden h max und h stochastisch und der entsprechende R.R.- 
Schatzer nichtlinear. Die theoretischen Eigenschaften dieses Schatzers sind 
unbekannt. 



Um sich einen Uberblick uber das Verhalten des R.R.-Schatzers in Abhangig- 
keit von h zu verschaffen, werden die |3 k als Funktionen von h grafisch darge- 
stellt. Diese Darstellung wird als Ridge Trace bezeichnet. 

Fur die praktische Anwendung des R.R.-Schatzers ist es von Bedeutung, daB 
die M inimum-Quadrat-Schatzung in folgendem Sinne instabil ist: Bei angena- 
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hert kollinearen Pradiktoren andern sich die b k aufgrund geringerer Anderun- 
gen der Daten in erheblichem MaBe. Fur die R.R.-Schatzung verringert sich 
diese I nstabi I itat; obwohl (und weil) sie nicht erwartungstreu ist, hat sie einen 
kleineren mittleren quadratischen Fehler. 

A Is erganzende Lekture konnen Floerl & Kennard (1970), Theobald (1974), 
Vinod (1978) und Jahn (1979) empfohlen werden. 



1.7 Klassisches korrelationsanalytisches Modell und 
multiple Korrelation 

Bei der Diskussion des regressionsanalytischen Modells wurde auf die beson- 
dere Bedeutung der Annahme hingewiesen, daB die Werte X der Pradiktoren 
teste Werte sind. Dies bedeutet fur die Interpretation der Wahrscheinlichkeit 
als relative Haufigkeit im Jong run", daB die Replikation der Beobachtungen 
zu immer denselben Pradiktorwerten erfolgen muB. M it Replikation der Be- 
obachtungen ist allerdings nicht die Wiederholung der Beobachtungen zum 
Aufbau einer Stichprobe, sondern die Wiederholung der Untersuchung an 
einer neuen Stichprobe gemeint. Die Annahme fester Pradiktoren ist fur viele 
psychologische Fragestellungen unreal istisch. In diesem Kapitel soil gezeigt 
werden, unter welchen veranderten Annahmen mit etwas abweichender Inter- 
pretation die bisher berichteten Ergebnisse beibehalten werden konnen, wenn 
stochastische Pradiktoren vorliegen, also die Pradiktoren selbst Zufallsvaria- 
blen sind. Als nicht leicht verstandliche, aber umfassende Lekture zu diesem 
Thema konnen Schonfeld (1971, p.l) Oder Graybill (1976, p. 373) empfohlen 
werden. Eine erste Einfuhrung in das korrelationsanalytische Modell bieten 
Gaensslen & Schubo (1976, p. 47). 

Das klassische korrelationsanalytische Modell (general linear regression model, 
unabhangige stochastische lineare Regression) umfaBt folgende Annahmen: 

( 51 ) Es besteht die Beziehung 
y = X|1 + u, 

wobei X eine Nx(K+ l)-Matrix von beobachtbaren Zufallsgro- 
Ben, B ein Vektor von festen, unbekannten Parametern mit 
K + I Komponenten, y ein Vektor von N beobachtbaren Zu- 
fallsgroBen und u ein Vektor von N unbeobachtbaren Zufalls- 
groBen ist. X und u (und damit y) besitzen eine gemeinsame 
Wah rschei n I i ch kei tsvertei lung. 

(52) Der Rang der Zufallsmatrix X ist mit Wahrscheinlichkeit 1 
gleich der Spaltenzahl K + 1. 

(53) E u (u|X) = 0 fiir alle Realisationen X. 

(54) E(u,u|X) = E u (u u'|X) = o 2 I fiir alle Realisationen X. 
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(5 5 ) Fur jede Realisation X ist die bedingte Verteilung von u 
N-dimensional normal. 

(56) Es existieren EX'X, E(X'X) 1 und E(X'X) ^X'. 

EX'X ist nichtsingular. 

(§ 7 ) Die Rand-Dichtefunktion f x (X) ist fur alle Realisationen X 

positiv. 

Die Annahmen SI bis S5 entsprechen weitgehend den fruheren Annahmen Al 
bis A5. Um in nicht zu grolSe Schwierigkeiten bei der Darstellung zu gelangen, 
wurde fur S4 auf die Moglichkeit einer beliebigen Kovarianzmatrix verzichtet. 
Ansonsten wurde dem Umstand Rechnung getragen, daft nunmehr Zufallsva- 
riablen auch fur X vorliegen, wodurch auch die zusatzlichen Annahmen S6 und 
S7 erforderlich werden. Weiterhin wird vorausgesetzt, daft die Pradiktoren 
fehlerfrei gemessen sind. 

Wichtig ist die Unterscheidung zwischen dem bedingten und unbedingten 
Erwartungswert; der bedingte Erwartungswert E u (u|X) bedeutet den Erwar- 
tungswert von u unter der Bedingung, daft X einen festen Wert annimmt, der 
unbedingte Erwartungswert Ex„(u) = Eu ist der Erwartungswert in der Rand- 
verteilung von u. Unter den Annahmen S3 und S7 gilt jedoch auch 

(66) E x,u(u) E x (E u (u | X)) = E x (0) = 0, 

so daG der unbedingte Erwartungswert wie der bedingte verschwindet. Ebenso 
ist wegen S4 und S7 

(67) £ U u = o 2 1- 

Durch Bildung des bedingten Erwartungswerts fur die Regressionsbeziehung 
in SI erhalt man fur jede Realisierung X 

(68) E u (y | X) = Xp. 

Insofern entspricht E u (y_ | X) einerseits E y aus Gleichung (16) und andererseits 
der Approximation y aus Gleichung (4) der beschreibenden linearen Regres- 
sion (vgl. Steyer, 1979; Moosbrugger, 1980a, 1980b). A Is Konsequenzen der 
Annahmen des stochastischen Modells (ohne die Normalverteilungsannahme 
S5) gilt: Die Fehler u und die Pradiktoren X sind unkorreliert, konnen aber 
stochastisch abhangig sein: 

(69) E x , u (X'u) = 0. 

Unter den Annahmen SI bis S7 behalten alle Ergebnisse (bis auf eine noch zu 
erwahnende Ausnahme) Gultigkeit, die wir im klassischen regressionsanalyti- 
schen Modell (Al bis A3, K4, A5) dargestellt hatten, alle Schatzer bleiben 
erwartungstreu, die Bereichsschatzungen sind nach wie vor gultig. Dies ist der 
Fall, obwohl fur die Verteilungsform der Pradiktoren keine Aussage gemacht 
wurde. So ist z.B. 
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(70) $=(X'xr‘X' y 

nicht notwendig normal vertei It, wie dies im klassischen regressionsanalyti- 
schen Modell der Fall ist. Der Schatzer (70) ist ubrigens in den Zufallsvariablen 
nichtlinear. Daraus resultiert die angekundigte Ausnahme: Er kann daher auch 
kein bester linearer erwartungstreuer Schatzer sein; er ist jedoch asymptotisch 
effizient (Schonfeld, 1971, p. 17). 



Im korrelationsanalytischen Modell ist es auch naturlich, ein MaB fur die 
Starke des Zusammenhangs 



(71) 



0y(Ol...K) - 



Spur E yy — No 2 
Spur L yy 



P'[E x (X'X) - ~ E x (X') J E x (X)] P 
P'[E x (X'X) - -L Ex(X') J E x (X)] p + No 2 
mit der Einsmatrix J, d.h. (J)k| = 1, 

in Form des multiplen BestimmungsmaBes aufzustellen. Die Wurzel q aus dem 
BestimmungsmaB heiBt multiple Korrelation. Da durch die Konstante x 0 kein 
Zusammenhang vermittelt wird, laBt man sie haufig in der Notation der mul- 
tiplen Korrelation weg: 

(72) 0 = 0y(O12...K) = 0y(12...K)- 

Eine alternative Darstellungsform der multiplen Korrelation fur den Spezial- 
fall, daB Kriterium und (echte) Pradiktoren insgesamt (K + l)-dimensional 
normal vertei It sind, wird in Graybill (1976, p. 113, 418) beschrieben. Wahlt 
man fur die Pradiktoren eine Punktverteilung, was dem klassischen regres- 
sionsanalytischen Modell entspricht, ist die Definition (71) nach wie vor an- 
wendbar, wobei die Symbole E x entfallen. In diesem Spezialfall wird beson- 
ders deutlich, daB der multiple Korrelationskoeffizient von den gewahlten 
Pradiktorwerten abhangt; allgemein hangt er von den Charakteristika der Ver- 
teilung der Pradiktoren ab, wie naturlich auch von B und o 2 . 

A Is Punktschatzung fur q 2 kann entsprechend Gleichung (71) 



b' 


X'X-^X'JX 


b 


b' 


X 

X 

1 

Zh 

X 

<-A 

X 

1 1 


b + (N — K— 1)6 2 



y'X(X'X ) -1 X'y y'Jy 



y'y- ^y'Jy 
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verwendet werden; dies ist genau gleich der schon in Gleichung (32) als empi- 
rische multiple Korrelation eingefuhrten GroBe R 2 . M it der Matrix der empiri- 
schen Kovarianzen der Pradiktoren 



(74) 



Sxx 



_L(X'x - A x'jx) = 

N v N J 



1 0 0 ...0 
0 Si S 12 . . . SiK 
0 S 21 S 2 . . . S 2 K > 



0 S K iS K 2. . . Sk J 



dem Vektor der empirischen Kovarianzen von Pradiktoren und Kriterium 



(75) 



•x,=4 r <X'y-- j ! r X'jy, 



und der Varianz des Kriteriums 



’o 

Sly 

s 2y 

s Ky, 



(76) s yy = (y'y - ^ y'Jy) = y 2 - y 2 = s 2 

erhalt man 



(77) 



p2 _ ^ S X xb 

s yy 



s Xy b _ s'x y Sxx 1 s Xy 

S yy Syy 



Wenn die Konstante x 0 aus den Matrizen und Vektoren ausgeschlossen wird, 
andert sich am Ergebnis nichts, d.h. daB in (74) die erste Zeile und erste Spalte, 
in (75) die erste Komponente entfallen kann. Wenn fur alle Variablen y und x k 
eine multivariate Normalverteilung vorliegt, ist R 2 der M axi mum- Likelihood - 
Schatzer. R 2 uberschatzt im Mittel die Model l-Korrelation und ist demgemaB 
nicht erwartungstreu (siehe Olkin & Pratt, 1958). Wenn man die Schrump- 
fungskorrektur 

(78) R 2 - 1 - (1 - R 2 ) 



anwendet, ist der Bias dieser modifizierten Schatzung geringer. Fur den Fall 
der einfachen Korrelation ist 



(79) 



r (1 - r 2 ) 

r = r 4- 

2 (N - 4) 



eine gute Naherung fur den unter der Voraussetzung der Binomalverteilung 
konstruierbaren (Olkin & Pratt, 1958; Graybill, 1976, p. 396) besten unver- 
zerrten Schatzer von p. 
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Eine Bereichsschatzung fur die multiple Korrelation g im Fall der Multinor- 
malverteilung ist in Graybill (1976, p. 419, 667) in tabellarischer Form angege- 
ben. Fur den Fall der einfachen Korrelation (K = 1) nutzt man die Tatsache 
aus, dal$ fur die bivariate Normalverteilung 



arctanh (r) — arctanh (g) 
VN - 3 



naherungsweise standardnormalverteilt ist, um Bereichsschatzungen zu bil- 
den. Ein naherungsweiser Konfidenzbereich zum Konfidenzgrad 1 - a ist 
daher durch 



(81) tanh ^arctanh — — j^ a/2 =))= 6 =tanh (arctanh -F — -^ a/2 =)) 

gegeben. 

Aus den genannten Bereichsschatzungen lassen sich wiederum Signifikanztests 
konstruieren. Die Nullhypothese g (0) = 0 ist der Nullhypothese P^ 0) = P^ 0) = 

. . . = PP = 0 gleichwertig. Deswegen eignet sich zur Priifung dieser Nullhy- 
pothese ebenso die Entscheidungsregel (34), die auch im korrelationsanalyti- 
schen Model I anwendbar ist. 



Da viele Begriffsbildungen und Ergebnisse fur das klassische regressionsanaly- 
tische M odell und das klassische korrelationsanalytische Modell gleicherma- 
Ren gelten, soil im folgenden vom klassischen Modell Oder vom Regressionsmo- 
dell (manche Autoren sprechen vom Allgemeinen linearen Modell) die Rede 
sein, wenn es sich um gemeinsame Eigenschaften der beiden Ansatze handelt. 



1.8 Modelle mit Fehlern in den Pradiktoren 

Ublicherweise geht man in der Regressionsanalyse davon aus, daR die beob- 
achtbaren Variablen exakt, d.h. ohne Fehler gemessen werden konnen. In der 
Regel sind die Variablen aber fehlerbehaftet; die Ursache liegt in zahlreichen 
Fehlerquellen, z.B. in der Erhebungstechnik (falsche Abgrenzungen, falsche 
Antworten), am Stichprobenfehler, an der Aufbereitung der Daten usw. Im 
folgenden werden Modelle mit fehlerbehafteten Variablen betrachtet. Als Lite- 
ratur hierzu konnen Klein (1953, p. 282-305), Malinvaud (1966, p. 
326-363), Cochran (1970), Schonfeld (1971, p. 100-124), SchneeweiR (1974, 
p. 216-232), Stroud (1974), Namboodiri et al. (1975), Wainer & Thyssen 
(1976), Aigner & Goldberger (1977), Maddala (1977, p. 292-319), Rock et al. 
(1977) und Dhrymes (1978, p. 242-268) herangezogen werden. 

Es mussen nun fur das Kriterium und jeden Pradiktor jeweils zwei Werte 
unterschieden werden: der richtige bzw. der tatsachlich beobachtete und damit 
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fehlerbehaftete. Um ersteren vom zweiten Wert in der Notation zu unterschei- 
den, wird er jeweils mit einem Stern versehen. 

Aus schreibtechnischen Grunden wird nun fur das Kriterium nicht mehr y, 
sondern Sq und fur die Pradiktoren einschlieBlich der bisherigen Konstante 
x 0 = l in abgeanderter Numerierung x k geschrieben (l < k f? K). Es bezeich- 
net also xV, bzw. x^ das tatsachliche bzw. beobachtete Kriterium zur Erhe- 
bungseinheit n und x* kn bzw. X kn den tatsachlichen bzw. beobachteten k-ten 
Pradiktor zur Erhebungseinheit n. 

Der Fehler in der Variablen X kn (0 k 5? K, l^n^N) wird mit v kn 
bezeichnet. Dieser Fehler kann additiv Oder prozentual sein. Es wird ein addi- 
tiver Zusammenhang unterstellt: 

Xkn = x ; L+v kn (0 S k S K, 1 S n S N). 

Die Regressionsbeziehung lautet: 

K 

Xon = XPkXkn + £n (1 ^ n N), 
k=l 



wobei e n den Fehler in der Gleichung erfaBt. 



In kompakter Matrizenform schreiben sich obige Beziehungen 



(82) 


X = X*+V, 


(83) 


Xq = X :: P + £. 



wobei X bzw. X* bzw. V jeweils NxK-Matrizen darstellen, B einen Spalten- 
vektor mit K Komponenten und x 0 * bzw. x 0 bzw. e Spaltenvektoren mit je N 
Komponenten. Wird Xq* in (83) gemaB (82) ersetzt, so ergibt sich 

(84) x 0 = X ;: 'P+e+v 0 . 

Aus (84) resultiert, daB der Effekt des Fehlers in der Gleichung, namlich e, 
derselbe ist wie der des Fehlers in der Variable x 0 , namlich v 0 . Wir setzen daher 
ohne Beschrankung der Allgemeinheit e zu Null. 

Wird weiter X* in (84) gemaB (82) ersetzt, so ergibt sich die entsprechende 
Beziehung in den beobachtbaren Variablen 

(85) x 0 = Xp+(v 0 — VP). 

Der Fehler in der Gleichung (85) wird zusammengefaBt zu 



u = v 0 — Vp. 




Regressions- und kanonische Analyse 



239 



Damit resultiert die ubliche Regressionsbeziehung 
(86) x o = Xp+u. 

Folgende Annahmen die Fehler betreffend werden getroffen: 

(PI) Die Fehlervariable v kn ist unabhangig von v im fur n ^ m und 

0 < k, 1 < K. 

(F2) (vqp, v ln v Kn ) besitzt eine von n unabhangige Verteilung und 

co k i bezeichnet die Kovarianz von v kn und v in bzw. £2 die ent- 
sprechende Kovarianzmatrix. M it £2 n bezeichnen wir die Ma- 
trix, die aus £2 durch Weglassen der ersten Zeile und Spalte 
entsteht, und mit Wj die erste Spalte von £2 aber ohne a) 00 . 

(F 3 ) Die Fehlervariablen v kn sind alle unabhangig von den xf n fur 

0 < k, 1 < K, 1 n ^ N. 

(F4) Ev kn = 0 fiir OfikfsK, l^n^N. 

Es wird zugelassen, daG einige der Variablen fehlerfrei beobachtbar sind, d.h. 
daG einige co kk verschwinden konnen. Nur co 0 o sei ungleich Null, da in v Q auch 
der Fehler in der Gleichung miterfaGt wird. 

Nun mussen noch die tatsachlichen Pradiktoren spezifiziert werden. Es gibt 
zwei M oglichkeiten: 

1. Die stochastische Spezifikation, nach der alle xt„ (l=k^K, l^n^N) 
stochastische Variable sind (und damit auch x$ n ); 

2. Die deterministische Spezifikation, nach der alle x£„ fest vorgegeben sind. 
In diesem Falle ist wegen (83) (man beachtee=0) auch x = g n fest vorgegeben. 

Bei stochastischer Spezifikation soil noch gelten 

, F5 ) lim ~ E (X-X-) - pita -AX*'X», 

und die Grenzwertmatrix M sei nichtsingular. 

Bei deterministischer Spezifikation soil gelten 

< F5 ') 's" -Fr x ”' x " 

existiert und die Grenzwertmatrix sei nichtsingular. 

Zuerst wird unabhangig von der Spezifikation der M inimum-Quadrat-Schat- 
zer fur (86) betrachtet. Nach Definition von u und gemaG (86) ergibt sich 



EX'u = E(X*-V) ' (v 0 -VP) = — EV'v 0 +(EV'v)p. 
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Daraus ergibt sich (auch fur den Fall, daft V und v 0 unkorreliert sind) eine 
Korrelation der beobachtbaren Pradiktoren mit der Fehlervariablen u. Daher 
ist der M inimum-Quadrat- Schatzer 

p = (X'Xy-’X'X 

verzerrt. 

GemaB (83) gilt aber (beachte e=0) 

X'Xp - X^-'xo 

Darin ersetzen wir X* und Xq* gemaB (82). Es ergibt sich also 
(X-V) ' (X-V)P = (X-V) ' (x 0 -v 0 ) 
bzw. durch Ausmultiplizieren, 

(87 ) (X'X-V'X-X'V+V'V)P = X'x 0 — V'x 0 — X'v 0 +V'v 0 . 

Wegen der getroffenen Annahmen ergibt sich asymptotisch 



und 



plim 4-V'X - plim 4-X'V - 0 
r N r N 

1 1 

plim ^V'x 0 = plim -jq-X'vo = 0 

plim 4-V'V = fi„ 
r N 

plim -^-V'vo = t»i. 



Daher ist das folgende Gleichungssystem asymptotisch Equivalent zu (87) 
(88) ( -j^X'X + n„)p = -j^X'xo + w, 

Wenn also S2 n und (Dj bekannt sind, so ergibt sich gemaB (88) aus den beob- 
achtbaren Variablen der Schatzer B, der nach obiger Flerleitung konsistent ist. 

Dieser Schatzer setzt die Kenntnis von S5 n und to, voraus. In vielen Fallen 
kann w, gleich Null gesetzt werden und £2 n als diagonal angenommen werden, 
d.h. die Fehler in den verschiedenen Variablen sind untereinander unkorre- 
liert. Trotzdem ist uber die Beobachtungen hinaus eine gewisse a priori Kennt- 
nis uber die Varianzen der Fehler in den Variablen notig, um die Parameter 
konsistent zu schatzen. Flier liegt ein Identifikationsproblem vor. Dieses wird 
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im Rahmen der stochastischen Spezifikation und bei Vorliegen von Normal- 
verteilungen noch genauer diskutiert. 

Die Struktur der Verzerrung des Minimum-Quadrat- Schatzers kann fur den 
Fall der Einfachregression Xg n = P!+p 2 x 2n genauer studiert werden. Das Abso- 
lutglied x ln = l kann naturlich ohne Fehler beobachtet werden. Weiter sei o> 01 
= 0 . 

Damit ergibt sich 

P = (X'Xr’X'xo 

bzw. 

plim p = (plim ±X*'X* + ® “J^plim^ X*'X*p) 

und 

plim p 2 = P2 

1 +^~ 
s 

wobei s = plim^£( x L-X2) 2 > x 2 =~f Z x 2 n • 

JN n IN n 

Offensichtlich wird p 2 immer unterschatzt und zwar um so mehr, je groBer das 
Verhaltnis der Varianz von v 2n zu x* 2n ist. Wenn wir z.B. N = 10 annehmen 
und x* 2n = Cl fur l < n < 5 bzw. x* 2n = c 2 # c x fur 6 < n < 10, so ist es relativ 
klein. Grafisch ergibt sich die Darstellung in Abb. 2. 




Abb. 2: Verzerrung der Regressionskoeffizienten, wenn der Pradiktor mit MeBfehler 
gemessen wurde. 



Es seien nun alle Fehlervariablen v kn und alle x* kn fur 0 < k £ K, l < n < N 
normal vertei It. Mit [i k wird der Erwartungswert von x* kn bezeichnet 

(0 ^ k ^ K). Es gilt dann wegen (83) 

K 

= Z M-kPk 

k=l 



( 89 ) 
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Mit £ =(o k i) wird die (K+l)x(K+l)-Kovarianz-M atrix von (x 0n ,. . .,x kn ) 
bezeichnet und mit £* = (o kl ) die KxK-Kovarianz-M atrix von (x* ln , . . „x* kn ). 

Es gilt dann 

o k i = o’ k |+C 0 ki fiir 1 ^ k, 1 ^ K 



K 

Ooo = Y PkOklPl + (t>00 

k,l=l 



K 

Ooi = Y PkO'ki+Woi fur 1 ^ 1 tS K. 

k— 1 



Mit diesen Bezeichnungen ergibt sich fur die Log-Likelihood-Funktion (bis 
auf einen unwesentlichen konstanten Term) 

M 1 N K 

- — ln( | det X | )- — Y Y ( x kn-tik)o^r 1) (xin— M-i) • 

n— 1 k,l — 0 

Aus den beobachtbaren Variablen konnen wir bestenfalls die Matrix X und 
|X 0 , . ,.,p, K erhalten. Die eigentlich interessierenden Parameter sind aber 
M-u • • ■jM'Kj P, £* und S2. 

Offensichtlich sind letztere viel zahlreicher und damit nicht alle identifizier- 
bar. Durch geeignete a priori Information z.B., daB il diagonal ist und gewis- 
se Hauptdiagonalelemente Null sind, kann Identifizierbarkeit erreicht werden. 

Fur den Fall der deterministischen Spezifikation kann eine andere Schatzfunk- 
tion hergeleitet werden. Die ersten K x ^ K Variablen seien fehlerbehaftet und 
die restlichen exakt beobachtbar. Diese K x ersten Variablen seien als X*! und \/ 1 
definiert. Damit gilt nun anstatt (82) und (83) 

(82 ’) X, = Xi+V 1 

und 

(83') xo = X'p 

Sei £i, die nichtsingulare Kovarianz-M atrix der Zeilen von V lf dann wird 
folgende gewichtete M inimum-Quadrat-Methode angewandt 

Spur (Xj— X^fif 1 (X,— X’l) =Minimum 

unter der Nebenbedingung (83'). Dabei werden die GroBen x* kn als Parameter 
angesehen, die „mitgeschatzt" werden. Der resultierende Schatzer ist konsi- 
stent. 
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1.9 Zeitreihenanalyse im allgemeinen regressionsanalytischen 
Modell 

In neuerer Zeit gewinnt in der Psychologie die auch quantitative Untersu- 
chung von zeitlichen Prozessen groRere Bedeutung, mit der die Untersuchung 
von Zustanden erganzt werden kann. Dies hat wohl nicht zuletzt seinen 
Grund darin, date wichtige Teile des quantitativ-methodischen Instrumenta- 
riums fur die speziellen Bedurfnisse der Veranderungsbeschreibung erst jungst 
entwickelt (Yule, 1927; Hannan, 1955; Hannan, 1960; Box und Tiao, 1965; 
Kendall & Stuart, 1966, p. 403-430; Malinvaud, 1966, p. 373-393, 
425-453; Box et al ., 1967; Box & Jenkins, 1970; Box & Pierce, 1970, Box & 
Tiao, 1975; Glass et al., 1975; Anderson, 1976; Kendall, 1976) Oder in die 
psychologische Literatur (Holtzmann, 1963; Huber, 1967; Huber, 1973; Dah- 
me, 1975; Dahme, 1976; Gudat & Revenstorff, 1976; Hersen & Barlow, 1976; 
Petermann, 1977a, 1977b, 1978; Revenstorff, 1979; Revenstorff & Keeser, 
1979; McCleary & Hay, 1980; Keeser, 1981) aufgenommen wurden. 



Das klassische regressionsanalytische Modell 
y = XP + u 

mit K4, wozu die Unkorreliertheit der Komponenten u n und u m fur n =£ m, 
1 ^ n, m < N, gehort, ist fur Zeitreihenanalysen deswegen nicht geeignet, weil 
in der Regel der nicht durch X erklarbare Anteil des Kriteriums, die Fehlerva- 
riable u, durch nicht erfaRte, zeitlich trage GroRen beeinfluRt wird. Bei einem 
Experiment zur Rauchertherapie wird zwar einerseits das Kriterium y, die 
Anzahl gerauchter Zigaretten, wesentlich durch die in den Pradiktorvariablen 
x k dargestellten Interventionen bestimmt sein, andererseits werden sich zeitlich 
kurzfristig und langerfristig wirksame EinfluRgroRen bemerkbar machen, de- 
ren Wirkung auf das Kriterium durch die Fehlervariable u zusammengefaRt 
wird. Beispielsweise wird ein zum Zeitpunkt t n auftretender Partnerkonflikt 
eines Klienten sich so auswirken, daR fur die Anzahl gerauchter Zigaretten die 
Fehlerwerte u n , u n+ i,. . . mit sich abschwachender Tendenz systematised er- 
hoht sind. Insofern wird das Kriterium nun von drei Varianzquellen bestimmt, 
den Pradiktoren, den Fehlern und der seriellen Abhangigkeit der Fehler. Un- 
ter bestimmten Umstanden, die an einem Beispiel noch naher erlautert wer- 
den, konnen derartige Zusammenhange durch den Ansatz einer von der Ein- 
heitsmatrix I verschiedenen Matrix V im allgemeinen regressionsanalytischen 
Modell berucksichtigt werden. 



Leider ist es so, daR in praktischen Fallen nicht einmal die Matrix V als 
Indikator der Struktur der Kovarianzmatrix der Zufallsvariablen u n 
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On 


Ol2 • • 


■ o 1N 


O 21 


°22 • • 


■ °2N 


ONI 


°n 2 • • 


• 0 N N 



bekannt ist. Die Matrix £ uu muB daher geschatzt werden, wobei es ausreicht, 
die wechselseitigen Verhaltnisse der Kovarianzen zu schatzen, wie sie in V 
erfaBt sind. Leider hat man zum Schatzen der (N(N+ l)/2)- l freien Parameter 
in V nur die N Werte y n zur Verfugung, so daft eine konsistente Schatzung der 
Matrix V so nicht moglich ist. Die Zahl der freien Parameter in L uu muR also 
dadurch verringert werden, daft ein angemessenes stochastisches Modell mit 
erheblich weniger freien Parametern angesetzt wird, das Beziehungen zwi- 
schen den Kovarianzen o nm definiert. 

Ist V geschatzt, kann in einer zweiten Phase die Schatzung der Regressionsko- 
effizienten und o 2 nach den in Kap. 1.3 beschriebenen Methoden erfolgen. 
Leider sind die dort angegebenen Eigenschaften der Schatzer nicht fur die hier 
beschriebene zweiphasige Schatzung (two step estimator) gultig. Unter wel- 
chen Bedingungen andere, nur asymptotische Schatzeigenschaften nachgewie- 
sen werden konnen, beschreibt etwa Schonfeld (1969, p. 207). Auch bei Vor- 
liegen der erforderlichen Normalverteilungsannahme sind die in Kap. 1.3 be- 
richteten Bereichsschatzungen und die daraus abgeleiteten Signifikanztests nur 
asymptotisch, fur endliche Zeitreihen also nur naherungsweise gultig. Natur- 
lich ist dabei die Naherung erheblich besser, als wenn die Abhangigkeit der 
Fehler ignoriert und falschlich das klassische regressionsanalytische Modell 
angenommen wird (Keeser, 1981, p. 281). Wie sehr das Signifikanzniveau 



Tabelle 1: Verzerrung der Irrtumswahrscheinlichkeit bei autokorrelierten Da- 
ten; relative Haufigkeiten von signifikanten Ergebnissen auf dem 
5 %-Niveau von jeweils 1000 Stichproben von Zufallszahlen beim 
t-Test und Mann-Whitney-Test fur verschiedene Verteilungsfor- 
men und verschiedene Werte der Autokorrelation (nach Box, 
1974). 



Q 


Test 


Normal 


Verteilungsform 

Rechteck 


X 2 (schief) 


0.0 


t-T est 


.054 


.056 


.047 


0.0 


M-W-Test 


.045 


.043 


.043 


- . 4 


t-T est 


.003 


.005 


.001 


- . 4 


M-W-Test 


.001 


.005 


.002 


+ .4 


t-T est 


.105 


.125 


.114 


+ .4 


M-W-Test 


.096 


.110 


.101 
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einfacher t-Tests (der t-Test ist der Test (37)) Oder von Mann-Whitney-Tests 
verfalscht wird, wenn die Fehler autoregressiv korreliert sind (siehe unten), 
zeigen die Ergebnisse einer Simulationsstudie von Box (1974), die in Tab. 1 
wiedergegeben ist. 

Fur die Anwendung des zweiphasigen Schatzers ist ein nichttri viales Problem 
das Aufstellen eines angemessenen und zugleich sparsamen stochastischen Mo- 
dells fur die Fehlervariablen, das in der Praxis anhand der vorliegenden Daten 
erfolgen muB. Eine Klasse von moglichen Modellen wird unter der Bezeich- 
nung ARIMA-Modell (autoregressive- integrated moving average model) zu- 
sammengefaBt. Die Eigenschaften des Modells, die Methoden zur Identifika- 
tion des speziell fur die Daten angemessenen Modells und die Schatzung der 
Parameter des Modells stellen z.B. McCleary & Flay (1980) und Keeser (1981) 
ausfuhrlich dar. Computerprogramme zur Bearbeitung dieser Aufgabe sind in 
den neueren Versionen der Programme BMDP2T (Dixon & Brown, 1981), 
SPSS-Prozedur BOX-JENKINS (Beutel & Schubo, 1982) und in der Unter- 
programmbibliothek IMSL (IMSL, 1979) enthalten. 

A Is einfachstes und am besten dokumentiertes (z.B. Johnston, 1963, p. 177; 
Schonfeld, 1969, p. 211; Schonfeld, 1971, p. 31; SchneeweiB, 1974, p. 180; 
Seifert, 1975, p. 109) Beispiel sollen die Ergebnisse beim autoregressiven Sche- 
ma erster Ordnung (AR(I) Oder A RIM A (1,0,0)) vorgestellt werden, woran 
das Prinzip der Vorgehensweise sichtbar wird. Dies ist der einfachste Ansatz, 
der jedoch leider fur die meisten Anwendungen z.B. in der Psychotherapiefor- 
schung nicht ausreicht. 

A Is stochastisches Modell fur die Fehlervariable wird angenommen: 

(Zl) u n = gu n ! + e n fur n = 2,3,... ,N mit 

(Z2) | g | < 1, Euj = 0, 

wobei fur die Zufallsvariablen e n gilt 
(Z3) Ee„ = 0 fiir n = 1,2,...,N 

(Z4) L ee = o 2 I 

(Z5) cov (u n — !, e n ) = 0 fiir n = 2,3,...,N 

Es besteht also ein linearer Zusammenhang zwischen den Fehlervariablen zu 
unmittelbar aufeinanderfolgenden Zeitpunkten t^ und t n , der selbst wieder 
von unregel maBi gen Zufallsschocks uberlagert wird. Fur die Beziehung auf- 
einanderfolgender Fehlervariablen wird demnach ein klassisches korrelations- 
analytisches Modell angesetzt. Unter den Bedingungen Zl bis Z5 folgt y n 
einem stationaren ProzeB. Es gilt 

(91) u n = Q n_1 u, + Q n ~ 2 e 2 + ... +p e n _, + e n fiir n = 2,3,...,N 

woraus sich wegen | q | < 1 ablesen laftt, daft die Zufallsschocks fiir spatere 
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Zeitpunkte einen immer schwacher werdenden EinfluB haben. Die Kovarianz- 
matrix der Fehlervariablen hat die Form 



(92) 



a 2 V mit 



i -e 



und 




0 Q 2 

1 0 



■■■ 0 
■ • • 0 



N— 1 
N— 2 



0 N -‘ 0 N “ 



-2 y N 



... 1 



Die fur die Schatzung der Regressionskoeffizienten benotigte 



(93) 



1 




-0 0 ... 0 0 

1+Q 2 —0 ... 0 0 

—0 1 + 0 2 ... 0 0 



0 0 0 . . . — 0 1 + 0 2 
0 0 0 ... 0 -0 



Inverse ist 

o' 

0 

0 

-0 

1 



Kennt man die Autokorrelation 0, dann lassen sich damit in der zweiten Phase 
innerhalb des allgemeinen regressionsanalytischen Modells alle Schatzungen, 
Prognosen und Tests exakt durchfuhren, vorausgesetzt die Normalvertei- 
lungsannahme A5 ist erf u 1 1 1. 

Im Falle des autoregressiven Schemas erster Ordnung (Wonnacott & Wonna- 
cott, 1970, p. 328) wie im allgemeinen ARIMA-Modell (Keeser, 1981, p. 207) 
laBt sich die sog. Aitken-Reduktion auf das klassische regressionsanalytische 
M odell auf besonders einfache Weise durch Differenzbildung durchfuhren. 
Man zerlegt V 1 in zwei Faktoren 

(94) V- 1 = D'D mit 

Vl - 0 2 0 
-0 1 

0 -0 

0 0 

0 0 

und erhalt in 

(95) y* = X*p+u* 




0 ... 0 0 

0 ... 0 0 

1 ... 0 0 

0 ... 10 
0 ... -0 1 



mit y* = Dy, X ■ = DX, u :: = Du 
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ein klassisches regressionsanalytisches Modell mit unkorrelierten Fehlervaria- 
blen (Du) n . DaG es sich bei D um eine Matrix handelt, die Differenzen aufein- 
anderfolgender Messungen bildet, sei an 







Vl-g 2 


yi 






y 2 - 


QYi 


(96) 


Dy = 


73 


QY2 






. Yn - 


QYn i . 



demonstriert; wie man sieht, muG die erste Messung etwas abweichend 
behandelt werden. Es genugt fur die Transformation in das klassische Modell 
ubrigens nicht, nur die Kriteriumswerte zu transformieren, auch die Pradik- 
torwerte mussen, wie aus (95) ersichtlich, mittransformiert werden. 

Bisher wurde davon ausgegangen, daG die Autokorrelation g bekannt ist. Im 
allgemeinen muG man sie jedoch schatzen (Phase 1). Dazu bildet man die 
OLS-Schatzungen (klassisches Regressionsmodell) fur die Residuen 

(97) u = y- X(X'X)— 'X'y 
und schatzt g durch 

N 

(98) 9= ~ 



Dieser Schatzer ist nicht erwartungstreu. Die Schatzung setzt man anstelle des 
Parameters g in den Gleichungen (92) bis (96) fur die zweite Schatzphase ein, 
die sonst wie in dem Fall erfolgt, in dem g a priori bekannt ist. 

Bestehen Zweifel, ob uberhaupt Autokorrelation der Residuen vorliegt, kann 
die Entscheidung daruber auch durch statistische Tests herbeigefuhrt werden. 
Pauschal kann etwa mit einem Runs-Test auf die geschatzten Residuen (97) 
entschieden werden, ob die Vorzeichen der Residuen tatsachlich regel los ver- 
teilt sind. Fur die spezifische Prufung der Nullhypothese, daB die Autokorre- 
lation g = 0 ist, mussen zwei Varianten unterschieden werden, die beide die 
Normalverteilungsannahme A5 erfordern. 

Fur die erste Variante mussen die beiden Residuen selbst bekannt sein, d.h. die 
Regressionskoeffizienten G mussen bekannt sein. Dann ist die Verteilung des 

von Neumann-Verlialtnisses 
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(99) 



Q(y) = 



1 

N-l 



N 

E K “ U n~l) 2 

n=2 




n=l 



U 



2 

n 



unter der Nullhypothese bekannt (Tabellen in Hart & von Neumann, 1942). 
Q ist symmetrisch um 2N/(N - 1) mit Varianz var Q = 4/ N verteilt. 

Fur den realistischeren Fall, daG nur die Schatzungen der Residuen nach (97) 
vorliegen, gibt es die zweite Variante, den Durbin-Watson-Test (Durbin & 
Watson, 1950, 1951, 1971), der auf der PrufgroBe 



(100) 



d = 



E (u n - u n _o 2 

n—2 

N 

E G n 



beruht. Es handelt sich dabei um einen „bounds-Test", bei dem untere und 
obere Schranken fur die Durbin-Watson-Statistik tabellarisch erfaRt sind (z.B. 
Koerts & Abrahamse, 1969). Die Tabellen sind in der Regel fur die einseitige 
Alternativhypothese p > 0 ausgelegt. Unterschreitet d die untere Schranke 
d Li0 , wird die Nullhypothese zugunsten der Alternativhypothese abgelehnt. 
Wird die obere Schranke du„ uberschritten, entscheidet man sich fur die Null- 
hypothese. Liegt d zwischen d L , a und d U-a , enthalt man sich des Urteils (s. 
Abb. 3). 



positive 






Autokor- 

relation 


? 


keine Autokorrelation 


//////A 


• 


.wwwjwwwwwwww 



o d L ,„ d Uia 2 4 



Abb. 3: Durbin-Watson-Test auf positive Autokorrelation. 

Die beiden besprochenen Tests sind fur die Diagnostik des autoregressiven 
Prozesses erster Ordnung konstruiert, der in Anwendungsfallen der Psycholo- 
gy eher selten vorzufinden ist. Fur allgemeinere serielle Abhangigkeiten haben 
Box & Pierce (1970) einen Model lanpassungstest entwickelt, den sie Porte- 
manteau-Test nennen. Zur Entscheidung, ob die Residuen einem periodischen 
Muster folgen, empfehlen Jenkins & Watts (1968) den Periodogramm-Test. 
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Wenn auch die Pradiktoren selbst Zufallsvariablen mit seriellen Abhangigkei- 
ten sind, mussen Transfermodelle (distributes lags, dynamische Regression) 
herangezogen werden (s. Box & Jenkins, 1970 ; McCleary & Hay, 1980 ). 



1.10 Suppression und Kollinearitat 

Die Interpretation von Regressionsanalysen ist deswegen haufig nicht einfach, 
weil die Regressionskoeffizienten stark von den Interkorrelationen der Pradik- 
toren abhangen. Die Schwierigkeiten bei der Interpretation einer Regressions- 
analyse werden an einem Beispiel aufgezeigt, dessen BestimmungsgroBen wir 
spater variieren. Dabei werden die Begriffe Wichtigkeit einzelner Pradiktoren, 
Suppression und Kollinearitat eingefuhrt und diskutiert. 

Cohen & Cohen (1975, p. 73) stutzen sich bei der Diskussion der Zerlegung 
der Varianz des Kriteriums, die durch eine Regressionsanalyse gegeben ist, auf 
ein Beispiel, das wir zur Illustration ubernehmen wollen. Es wird eine Stich- 
probe von Mitgliedern des Lehrkorpers von Universitaten untersucht. A Is 
Kriteriumsvariable y dient der akademische Rang einer Person, der, ubertra- 
gen auf deutsche Verhaltnisse, dadurch skaliert wird, daB von der Besoldungs- 
gruppe HI bis H4 der Buchstabe entfernt wird; Mitgliedern des akademischen 
Mittelbaus konnte wahlweise der Wert 1 Oder 0 zugewiesen werden. Der 
Zusammenhang zwischen diesem Kriterium und den beiden Pradiktoren x x = 
Anzahl der Publikationen und x 2 = akademisches Alter = Anzahl der Jahre 
seit der Promotion soil untersucht werden. Wenn die Personen der Stichprobe 
zufallig aus der Grundgesamtheit entnommen werden, liegt ein klassisches 
korrelationsanalytisches Modell vor; wegen der Zufallsreihenfolge in der 
Stichprobe sind serielle Korrelationen ausgeschlossen. Falls fur die Argumen- 
tation erforderlich, wollen wir fur die Residuen Normalverteilung annehmen, 



Tabelle 2: Die Ergebnisse zum Beispiel von Cohen & Cohen (1975, p. 74). Der 
Stichprobenumfang ist N = 15. 



Variable 


Akad. Rang 
Y 


Konstante 

x 0 


Anz. Publik. 

Xl 


Akad. Alter 
x 2 


Mittelwert 


1.8 


1.0 


7.6 


9.6 


Standardabw. s 


.748 


.0 


4.96 


7.25 


einf. Korr. mit y 


1.0 


- 


.463 


.612 


einf. Korr. mit xj 


.463 


- 


1.0 


.683 


Regressionskoeff. b k 


- 


1.15 


.013 


.057 


Regressionskoeff. b k 


- 


.0 


.084 


.555 


fiir stand. Variablen 
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obwohl sie wegen der Diskretheit des Kriteriums und der Beschrankung des 
Wertebereichs sicher hochstens in schlechter Naherung gegeben sein kann. 
Die meisten Interpretationen benotigen jedoch die Normalverteilungsannah- 
me nicht. AuBerdem sollen zwischen alien drei Variablen nur lineare Zusam- 
menhange bestehen. Die wichtigsten Ergebnisse der empirischen Regression 
mit den Schatzungen der Regressionskoeffizienten im klassischen Modell sind 
in Tab. 2 enthalten. 

In dieser Tabelle sind neben den Regressionskoeffizienten aus 
(101) Yn = b 0 +b,x nl +b 2 x n2 (1 < n < N) 

auch die Regressionskoeffizienten fur die standardisierten Werte 



( 102 ) 



An 



y n -y 



J ^nk 






Sk 



(1 = n ^ 



enthalten. Die Regressionskoeffizienten b* k fur standard i si erte Werte (in der 
Literatur werden sie haufig auch Beta-Gewichte genannt) sind deshalb ange- 
nehmer fur die Interpretation, weil sie nicht von der Skalierung, d.h. von den 
MaBeinheiten der Variablen abhangen. Sie sind die BestimmungsgroBen zur 
OLSSchatzung der standardisierten Kriteriumswerte 

( 103 ) z yn = bjz nl + bjz n2 (1 ^ n 5? N), 

wobei die Variable x 0 nicht mehr berucksichtigt werden muB. 



In Abb. 4 werden die Anteile gemeinsamer Varianz durch das Uberlappen von 
Kreisscheiben dargestellt und mit den entsprechenden einfachen semi parti el I en 
(Cohen & Cohen, 1975, p. 81; Gaensslen & Schubo, 1976, p. 88) Oder multip- 
len Korrelationen etikettiert. Die quadrierten Korrelationskoeffizienten sind 
zugleich die erklarten Varianzen, wenn es sich urn standardisierte Variable 
handelt. 



Richtig wiedergegeben wird in Abb. 4, daB fur Flache a verschiedene aquiva- 
lente Berechnungsmoglichkeiten bestehen 

(104) a = Ry( 1 2) — r“ c 1_2) — r- (2 — 1 ) 

= ryi-r^(i_2) 

= r y2-r?(2-i) 

= .2106. 

Doch ist die Abbildung insofern gefahrlich, als sie nicht berucksichtigt, daB 
dieser Betrag bei anderen Daten durchaus negativ sein konnte (s. Tab. 3). 
Auch konnen in einer derart vereinfachten Abbildung haufig die Beziehungen 
der Pradiktoren untereinander nicht angemessen dargestellt werden. 
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Akadem. Rang y 




Abb. 4: Die Varianzzerlegung bei der Regression mit zwei Pradiktoren im Beispiel von 
Cohen & Cohen (1975, p. 74). 



Wie laBt sich dieses Ergebnis nun deskriptiv interpretieren? Einerseits besteht 
ein Zusammenhang zwischen der Anzahl der Publikationen und dem akademi- 
schen Rang, der wechselseitig 21% der Varianz erklart; uber eine kausale 
gerichtete Abhangigkeit lal$t sich bei Querschnittsuntersuchungen nie etwas 
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aus den Daten, sondern allenfalls aufgrund einer Theorie uber den Gegen- 
standsbereich aussagen. Andererseits besteht ein noch starkerer Zusammen- 
hang (erklarter Varianzanteil 37%) zwischen dem akademischen Alter und 
derm akademischen Rang. Die Betrachtung des gemeinsamen Zusammenhangs 
der Variablen Anzahl der Publikationen und akademisches Alter mit dem 
akademischen Rang wirft gegenuber der isolierten Betrachtung der Pradikto- 
ren ein neues Licht vor allem auf die Rolle der Anzahl der Publikationen. Der 
durch sie zusatzlich erklarte Anteil der Kriteriumsvarianz betragt namlich nur 
r 2 y r i_ 2 ) = .0038 und ist demnach verschwindend gering. In der Begriffsbildung 
von Bortz (1977, p. 596) ist die Anzahl der Publikationen demnach eine redun- 
dante Pradiktorvariable. Das bedeutet, daR fur die Schatzung des akademi- 
schen Rangs die Hinzunahme der Anzahl der Publikationen zum akademi- 
schen Rang keine Verbesserung erbringt. Dies zeigt sich ubrigens nicht so 
deutlich an den Regressionskoeffizienten b* k , wo z xl mit 0.084 gewichtet ist. 
Durch den Zusammenhang zwischen x x und x 2 entsteht eine schwache Kolli- 
nearitat, die dazu fuhrt, daR aus beiden Pradiktoren gleichermaRen schatzbare 
Anteile des Kriteriums auf die Pradiktoren aufgeteilt geschatzt werden. 



Um zu demonstrieren, wie sehr die Ergebnisse von der Korrelation der Pra- 
diktoren unter sonst gleichen Umstanden abhangen, werden einige fur die 
Interpretation einer Regressionsanalyse wichtige GroRen in Abhangigkeit von 
der Pradiktorenkorrelation dargestellt. Die Regressionskoeffizienten fur stan- 
dardisierte Variablen konnen im hier behandelten Fall zweier Pradiktoren nach 



(105) 



t>i = 



r yi — r y 2 r i 2 u * _ r y2 -r yl r 12 

l-r? 2 ’ b2_ 1 — r? 2 



die quadrierten semipartiellen Korrelationen, die den zusatzlichen Varianzbei- 
trag der Variablen angeben, nach 



_ r yl -r y2 r 12 _ r y2 -r yl r 12 

(106) r y(l-2) , y . , r y( 2 -l) - 



V 1 — rf 2 



Vu 



und der insgesamt erklarte Varianzanteil nach 



(107) 



t> 2 _ (ryi-ry2) 2 , ^ r yi r y2 

Ry{12) WT T + ril 



berechnet werden. Aus der Bedingung, daR R^q den Wert l nicht ubersteigen 
darf, ergibt sich der zulassige Wertebereich fur r 12 



(108) 



r yi r y 2 — Vci-r^o (1— r y2 ) ^ r 12 < r yl r y2 + V(l-r^) (l-r^ 2 ). 



Fur die Grenzen dieses Intervalls wird der insgesamt erklarte Varianzanteil 
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stets 1. Der minimal erklarte Varianzanteil wird, wenn o.B.d.A. |r yl |^|r y2 |, 

r y1 

(109) r i 2 ~~r~ 

r y2 

angenommen und sein Betrag ist dann 

R 2 — r 2 

A v(12) - r y2 • 

Die konkreten Ergebnisse fur die im Beispiel vorliegende Pradiktorkorrelation 
und einige weitere Korrelationswerte sind in Tab. 3 wiedergegeben. Es uber- 
rascht, wie stark die Ergebnisse voneinander abweichen, obwohl die Starke des 
Zusammenhangs jedes einzelnen Pradiktors zum Kriterium stets dieselbe ist. 

Leider sind die Ergebnisse nur fur zwei Falle leicht zu interpretieren: Zum 
ersten im Fall der minimal erklarten Varianz, r 12 = 0.463/0.612 = .757, bei 
dem die Schatzung des Kriteriums ausschlieBlich durch den damit am starksten 
korrelierenden Pradiktor erfolgt, und zum zweiten im Fall r 12 =0, wo die 
Pradiktoren unkorreliert sind. In alien anderen Fallen ist es prinzipiell unmog- 
lich, befriedigende MaBzahlen fur den alleinigen Beitrag einer Pradiktorvaria- 
blen innerhalb der gemeinsamen Schatzung herauszunehmen, so sehr der 
Praktiker sich Flinweise auf die Wichtigkeit Oder Bedeutung einzelner Pradik- 
toren wunscht. Dennoch werden als Indizes der Wichtigkeit einzelner Pradik- 
toren die einfachen Korrelationen mit dem Kriterium, die Regressionskoeffi- 
zienten fur standard i si erte Variablen, die quadrierten semi parti el I en Korrela- 
tionen Oder die Produkte von einfacher Korrelation und Regressionskoeffi- 
zient fur standardisierte Variablen herangezogen. Alle diese GroBen haben 
ihre sinnvolle Bedeutung, doch sind siealle nur in den beiden genannten Fallen 
der leichten Interpretierbarkeit als Indizes fur den eigenstandigen Beitrag eines 
Pradiktors uneingeschrankt verwendbar. Die spezifischen Vor- und Nachteile 
dieser GroBen werden am ausfuhrlichsten von Darlington (1968) diskutiert. 

Recht kontrovers wird in der Literatur auch die Frage diskutiert, was unter 
Suppressorvariablen verstanden werden soil, und wie sie noch naher charakte- 
risiert und gegliedert werden konnen. Gemeinsam ist die Forderung, daB eine 
Suppressorvariable eine Variable sein soil, die im Kontext der ubrigen Pradik- 
toren die erklarte Varianz in einer Weise erhoht, die man zunachst (aufgrund 
der einfachen Korrelationen) nicht vermutet hatte. Bortz (1977, p. 597) defi- 
niert als Suppressorvariablen solche, die den Vorhersagebeitrag einer (oder 
mehrerer) anderen Variablen erhoht, indem sie irrelevante Varianzen in der 
(den) anderen Pradiktorvariablen unterdruckt. Bortz operational i si ert dies in 
Anlehnung an Conger & Jackson (1972) und Conger (1974) fur den Fall zweier 
Pradiktoren dadurch, daB er bV y i >r 2 y i, fordert, wenn x 2 eine Suppressorvaria- 
ble sein soil. Darlington (1968) polt alle Pradiktoren so um, daB ihre einfache 
Korrelation mit dem Kriterium nicht negativ ist, und nennt die Pradiktoren 
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Suppressorvariablen, deren Regressionskoeffizient b k negativ ist. Fur den Fall 
zweier Pradiktoren folgt daraus die Bedingung r y2 ri(|. y ) < r y ir 2 (i_ y ), wenn x 2 
eine Suppressorvariable sein soil. Gaensslen & Schubo (1976, p. 117, 123) 
sprechen dann von einer Suppressorvariablen, wenn siefur sich mit dem Krite- 
rium praktisch nicht korreliert, aber im Zusammenhang mit den ubrigen Pra- 
diktoren den insgesamt erklarten Varianzanteil erhoht. Im Beispiel nennen sie 
x 2 eine Suppressorvariable, wenn r 2 ^) groR gegenuber r 2 y2 bzw. wenn |r y2 r 12 | 
groR gegenuber |r yl | ist. Cohen & Cohen (1975, p. 91) nennen x 2 dann eine 
Suppressorvariable, wenn b* 2 auRerhalb des Intervalls zwischen 0 und r y2 liegt. 
Velicer (1978), der Conger kritisiert, spricht ahnlich wie Gaensslen & Schubo 
(1976) dann von Suppression, wenn r 2 y(2 .D groRer als r 2 y2 , ist. H ol I i ng (1980) 
schlieRlich verwendet als Kriterium r y(2 .|) > r y2 bzw. gleichwertig r y(2 _i) > r y2 , 
wenn x 2 so gepolt ist, daR r y2 positiv ist. 

Unter Kollinearitat Oder M ulti kol I i nearitat versteht man, daR die Matrix X'X 
singular Oder fast singular ist. Den Fall der exakten Kollinearitat hatten wir 
durch Annahme A5 in Kap. 1.2 ausgeschlossen; er soil fur das weitere ausge- 
schlossen bleiben. Eine Verbesserung der Schatzungen fur die Regressionsko- 
effizienten war unter dem Titel Ridge-Regression in Kap. 1.6 vorgeschlagen 
worden. Flier sollen noch praktische Auswirkungen der Kollinearitat ange- 
deutet werden. 

Stellt man einen gemeinsamen Konfidenzbereich aus den Daten des Beispiels 
fur die beiden Regressionskoeffizienten fur standardisierte Daten 

(110) = P 2 = t;P 2 

auf, so erhalt man aus Gl. (22) unter Annahme des klassischen Modells die 
Unglei chung 

(111) Z t r ki Ok-bD (Pi - b,) F a (K,N— K— 1) , 

k=l 1=1 



welche das Innere einer Ellipse mit Mittelpunkt (b* lf b* 2 ) beschreibt. In Abb. 5 
sind die Konfidenzbereiche zu r yl = .463, r y2 = .612 und verschiedene, aus 
Tab. 3 ausgewahlte Werte fur r 12 abgebildet. Wir wollen hier davon absehen, 
daR die Mittelpunkte der Ellipsen in Abhangigkeit von r 12 variieren. Was jetzt 
vor allem interessieren soil, ist, daR die Ellipsen um so eher gestreckt sind, je 
groRer der Betrag von r 12 ist. Fur r 12 =0 erhalt man den Grenzfall eines Kreises 
als Konfidenzbereich, was davon herruhrt, daR die Schatzungen b* 2 und b* 2 
unkorreliert sind. Wenn r 12 hoch ist, ist auch die negative Kovarianz der 
Schatzungen hoch; dies bedeutet, daR bei zufalliger Uberschatzung des einen 
Regressionskoeffizienten der andere Regressionskoeffizient eher unterschatzt 
wird. Jeder Regressionskoeffizient kann dann fur sich nicht zuverlassig ge- 
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Abb. 5: Konfidenzbereiche der Regressionskoeffizienten fur r y i = .463, r y2 = .612 und 
verschiedene Werte der Pradiktoreninterkorrelation r 12 . 



schatzt werden. Die Zuverlassigkeit einer Prognose durch die Regressionsglei- 
chung als Ganzes ist durch die Kollinearitat der Pradiktoren jedoch nicht 
beeintrachtigt. uber Moglichkeiten zur Orthogonal isierung von Pradiktoren 
berichtet Silvey (1969); Probleme der kollinearen Testauswertung diskutieren 
Schubo & Hentschel (1978) und Schubo (1980); uber Schwierigkeiten bei Si- 
gnifikanztests informiert Gordon (1968). 
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1.11 Schrittweise Regression 

In vielen Bereichen der empirischen Forschung weiB man zwar, daft Zusam- 
menhange zwischen einem Kriterium und einer groBeren Menge von Pradik- 
torvariablen bestehen, doch fal It eine Entscheidung daruber schwer, welche 
Untermenge der Pradiktorvariablen den Zusammenhang vermittelt. Eine Re- 
duktion der Anzahl der Pradiktorvariablen ist aus Grunden der sparsameren 
Beschreibung wunschenswert. Wenn fur das Forschungsgebiet keine Erfah- 
rungen Oder theoretische Flinweise vorliegen, wenn also keine a priori Reduk- 
tion der Pradiktoren moglich ist, ist man darauf angewiesen, die Variablenre- 
duktion aufgrund der Zusammenhange durchzufuhren, die sich im vorliegen- 
den Datensatz zeigen. Die in Kap. 1.10 angefuhrten MaBe fur die Wichtigkeit 
der Pradiktoren werden auch zu dem Zweck berechnet, Richtlinien fur die 
Variablenreduktion zu erhalten. In diesem Kapitel sollen einige Methoden zur 
Auswahl der Pradiktoren diskutiert werden, die z.B. in Draper & Smith 
(1966, p. 163), Cohen & Cohen (1975, p. 102) und Graybill (1976, p. 439) 
vorgeschlagen werden. 

Da die Potenzmenge der Menge der Pradiktoren endlich ist, steht im Prinzip 
dem nichts im Wege, der Reihe nach jede der 2 K -I moglichen nichtleeren 
Untermengen der Pradiktoren fur Regressionsanalysen mit dem Kriterium zu 
verwenden. Diese Vorgehensweise wird als Untermengen-Methode (subset 
regression, all regressions method) bezeichnet und ist rechnerisch sehr auf- 
wendig. Die „beste" Einzelregression ist diejenige, die einerseits einen groBen 
Varianzanteil erklart, andererseits jedoch nur wenige Pradiktoren verwendet. 
Die Einzelregression mit dem besten KompromiB zwischen diesen beiden 
gegensatzlichen Forderungen kann z.B. in einer ahnlichen Weise wie beim 
Scree-Test der Faktorenanalyse (z.B. Gaensslen & Schubo, 1976, p. 226) da- 
durch bestimmt werden, daB in einem Kreuzdiagramm das maximale Be- 
stimmtheitsmaB fur eine feste Zahl k von Pradiktoren gegen die Zahl k aufge- 
tragen wird. Andere Kriterien und schnelle Algorithmen findet man bei Garsi- 
de (1965), Flocking & Leslie (1967), LaMotte & Flocking (1970), Furnival 
(1971), Hocking (1972), Morgan & Tatar (1972) Oder auch in IMSL (1979). 

In sozialwissenschaftlichen Anwendungen ist allerdings fur die Einschatzung 
der gefundenen besten Regression groBte Vorsicht erforderlich. Eine Kreuzva- 
lidierungsstudie zur Uberprufung der Regression (s. Kap. 1.5: Prognosetest) 
mit einer unabhangigen Stichprobe ist obligat. Es genugt keinesfalls, fur die 
gefundene Regression einen Signifikanztest durchzufuhren, weil die tatsachli- 
che Irrtumswahrscheinlichkeit erheblich das gewahlte Signifikanzniveau uber- 
steigt. Aus Schubo (1982) wurdeTab. 4 entnommen, die fur das Signifikanzni- 
veau 5% die effektive Irrtumswahrscheinlichkeit angibt. Beispielsweise ist die 
Wahrscheinlichkeit dafur, daB der Zusammenhang zwischen den drei besten 
Pradiktoren aus insgesamt 13 Pradiktoren auf dem 5%-Niveau signifikant 
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wird, gleich 58%, wenn in Wirkl ichkeit keinerlei Zusammenhang zwischen 
dem Kriterium und den Pradiktoren und zwischen den Pradiktoren unterein- 
ander besteht. 

Tabelle 4: Gesamt-lrrtumswahrscheinlichkeit bei der empirischen Auswahl 
der Pradiktoren mit dem starksten Zusammenhang zum Kriterium 
(Irrtumswahrscheinlichkeit a = .05 fur den Einzeltest). 



Gesamtzahl 
der Pradik- 
toren K 


Anzahl 
1 2 


verwendeter Pradiktoren 
3 4 5 6 7 


8 


9 


10 


beliebig 


2 


.10 


.05 


_ 


- 


. 


- 


- 


. 


- 


- 


.12 


3 


.14 


.10 


.05 


- 


- 


- 


- 


- 


- 


- 


.17 


4 


.19 


.14 


.09 


.05 


- 


- 


- 


- 


- 


- 


.22 


5 


.23 


.19 


.14 


.08 


.05 


- 


- 


- 


- 


- 


.27 


6 


.26 


.26 


.19 


.14 


.09 


.05 


- 


- 


- 


- 


.32 


7 


.30 


.31 


.24 


.17 


.13 


.08 


.05 


- 


- 


- 


.38 


8 


.34 


.36 


.32 


.25 


.18 


.13 


.08 


.05 


- 


- 


.43 


9 


.37 


.39 


.36 


.30 


.24 


.17 


.12 


.08 


.05 


- 


.46 


10 


.40 


.43 


.41 


.37 


.31 


.23 


.18 


.12 


.08 


.05 


.51 


11 


.43 


.50 


.46 


.42 


.36 


.29 


.22 


.16 


.12 


.09 


.56 


12 


.46 


.53 


.52 


.49 


.44 


.37 


.30 


.23 


.17 


.12 


.61 


13 


.49 


.56 


.58 


.55 


.51 


.45 


.38 


.30 


.23 


.17 


.66 


14 


.51 


.60 


.62 


.61 


.56 


.51 


.43 


.36 


.29 


.22 


.72 


15 


.54 


.64 


.67 


.65 


.61 


.56 


.49 


.43 


.36 


.29 


.75 


16 


.56 


.68 


.71 


.70 


.67 


.63 


.58 


.52 


.43 


.35 


.77 


17 


.58 


.69 


.72 


.73 


.71 


.67 


.62 


.57 


.49 


.43 


.80 


18 


.60 


.73 


.77 


.76 


.75 


.71 


.67 


.61 


.56 


.50 


.83 


19 


.62 


.76 


.80 


.80 


.79 


.75 


.72 


.67 


.62 


.55 


.85 


20 


.64 


.78 


.82 


.83 


.82 


.81 


.78 


.75 


.70 


.64 


.88 


25 


.72 


.84 


.90 


.91 


.91 


.89 


.87 


.85 


.83 


.80 


.96 


29 


.77 


.91 


.93 


.96 


.97 


.96 


.95 


.94 


.93 


.92 


.98 



Dieselbe Problematik besteht bei drei weiteren Methoden zur empirischen 
Auswahl von Pradiktoren, der Vorwarts-M ethode, der Ruckwarts-M ethode 
und der A ustausch-M ethode. Alle diese Methoden sollen mit geringerem Auf- 
wand eine beinahe so gute Untermenge der Pradiktoren finden, wie sie die 
Untermengen-M ethode liefert. Bei alien Methoden werden schrittweise Pra- 
diktoren in die Regressionsgleichung aufgenommen bzw. wieder ausgeschie- 
den. Keine der drei Methoden fuhrt mit Sicherheit zur definiert besten Unter- 
menge der Pradiktoren im zuvor genannten Sinn. 
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Bei der Vorwarts-Methode wird zunachst die einzelne, mit dem Kriterium am 
starksten korrelierende Variable aufgenommen, dann als zweiter Pradiktor die 
Variable, die den groBten Zugewinn des Zusammenhangs bewirkt, usw. Bei 
der Riickwarts-Metliode werden aus dem Regressionsansatz mit alien Pradik- 
toren jeweils die Variablen ausgeschieden, deren Entfernen die kleinste Ver- 
minderung des Zusammenhangs zur Folge hat. Bei der Austausch-Methode 
wird im Prinzip wie bei der Vorwarts-Methode vorgegangen, doch wird nach 
der Aufnahme neuer Pradiktoren in den Regressionsansatz jeweils gepruft, ob 
andere Pradiktoren aus ihm entfernt werden konnen, ohne daB der Gesamtzu- 
sammenhang erheblich zuruckgeht. Gleichzeitig kann bei alien Methoden die 
Aufnahme naherungsweise kollinearer Pradiktoren ausgeschlossen werden. 
Fur den endgultigen Aufbau der Regressionsgleichung ist es im Fall der Kolli- 
nearitat zweier Oder mehrerer Pradiktoren meist dem Zufall vorbehalten, wel- 
che Pradiktoren herangezogen werden. Beinahe alle Computerprogramme er- 
moglichen die Pradiktorenauswahl nach wenigstens einer dieser drei Metho- 
den, wobei leider fur die endgultige Pradiktorenauswahl der Signifikanztest 
mit falscher Irrtumswahrscheinlichkeit berechnet wird. Der Anwender dieser 
Programme wird zwar subjektiv glucklicher, weil er einen signifikanten Zu- 
sammenhang berichten kann, doch besteht sein unbemerktes Ungluck darin, 
daB er mit aller Wahrscheinlichkeit eine nicht gerechtfertigte Entscheidung 
trifft. 

Eine erheblich geringere Verfalschung der Irrtumswahrscheinlichkeit ist durch 
eine Vorgehensweise fur Pradiktorengruppen gegeben, wie sie von Cohen & 
Cohen (1975, p. 123) ausfuhrlich beschrieben wird. Dabei werden die Pradik- 
toren a priori in disjunkte Variablengruppen A, B, usw. eingeteilt. Die Eintei- 
lung erfolgt entweder nach strukturellen Oder nach funktionalen Gesichts- 
punkten. Ein struktureller Gesichtspunkt ist etwa, wenn die K A = g-l Ko- 
diervariablen (z.B. Dummyvariablen) zu einer qualitativen Variablen mit g 
Auspragungen in eine Gruppe A zusammengefaBt wird, Oder wenn nichtlinea- 
re Effekte einer quantitativen, standardnormalverteilten Variablen z durch eine 
Gruppe B von K B = 3 orthogonalen Flermiteschen Polynomen z, z 2 -l, z 3 -3z 
berucksichtigt werden. Nach funktionalen Gesichtspunkten konnte man Pra- 
diktoren des Studienerfolgs etwa in die Gruppen Reifezeugnisnoten (A), Lei- 
stungstest-variablen (B), motivationale Variablen (C) und Lebenslauf-Daten 
(D) einteilen. 

Um die Vorgehensweise ubersichtlich darstellen zu konnen, mussen wir zu- 
nachst eine kompakte Schreibeweise fur die Behandlung von Variablengrup- 
pen einfuhren. Wenn die Gruppe A von Pradiktorvariablen 

A = { x l5 x 2 ,..., x Ka } 

ist, schreibt man fur die multiple Korrelation kurz 
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Ry(A) - Ry(12...K A ) 

und, wenn C die Vereinigung von A und B ist, 

Ry(AB) = Ry(C)- 

Die quadrierte semipartielle multiple Korrelation 

(112) Ry(A-B) = Ry( AB) Ry(B) 

ist dann der Varianzanteil des Kriteriums y, der durch die Hinzunahme von A 
zusatzlich zu B erklart wird. Fur den Fall dreier Gruppen von Pradiktoren 
kann in dieser Begriffsbildung eine hierarchische Zerlegung 

(113) Ry(ABC) ~ Ry(A) + Ry(B-A) + Ry(C-AB) 

der erklarten Varianz vorgenommen werden. Ob die zu den Variablen der 
Gruppe A gehorenden Regressionskoeffizienten alle Null sind 

Pi = P 2 = • • ■ = Pk a = 

kann durch die Entscheidungsregel zum Verwerfen dieser Nullhypothese 

(in) ( n-k a -k»- i )(r;, a .,-r;, b ’ > > Fa(KAiN „ KA _ KB _ 1) 

■K-A(t K y(AB)j 

entschieden werden, wenn die Annahmen des klassischen Modells fur den 
Ansatz mit den zwei Satzen A und B von Pradiktoren erf u 1 1 1 sind. Fur den 
Fall, daft A nur eine Variable enthalt, entspricht dies genau der Entscheidungs- 
regel (37). 



Welche Strategien sich fur die Signifikanztests bei Variablengruppen anbieten, 
soil nun am bereits erwahnten Beispiel der Kriteriumsvariablen Studienerfolg 
demonstriert werden. Einerseits kann im Rahmen des vollen Satzes von Pra- 
diktoren ABCD jeweils gepruft werden, ob die einzelnen Gruppen zusatzlich 
zu den drei ubrigen Gruppen signifikante Varianzanteile erklaren. Beispiels- 
weise ware der Test dafur, ob die motivationalen Variablen C zusatzlich zu 
den Reifezeugnis-Noten A, den Leistungstest-Variablen B und den Lebens- 
lauf-Daten D Varianzanteile erklaren, durch 



(115) 



(N— K— 1) (R"y(ABCD) R 2 y(ABC)) 
Kc(l — R 2 y(ABCD)) 



gegeben, wobei die Gesamtzahl der Pradiktoren 



> F a (K c ,N— K— 1) 



K = K a +K b +K c +K d 



ist. Diese erste Strategie entspricht der ersten Stufe der Ruckwartsmethode. 
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Entsprechend der Vorwartsmethode wird die zweite Strategie gewahlt, mit 
dem Unterschied, daR nach i nhaltl ichen Gesichtspunkten a priori eine Hier- 
archie fur die Aufnahme in die Regression festgelegt wird. Beispielsweise 
konnte es vernunftig erscheinen zu untersuchen, ob erstens die Reifezeugnis- 
noten A fur sich mit dem Studienerfolg zusammenhangen, ob zweitens die 
Leistungstest-Variablen B eine Verbesserung der Starke des Zusammenhangs 
mit sich bringen, ob drittens die motivationalen Variablen C zusatzlich zu A 
und B beitragen, und ob schlieRlich die Aufnahme von Lebenslauf-Daten D 
sinnvoll Oder erforderlich ist. Wieder sei die Entscheidungsregel fur die Auf- 
nahme der motivationalen Variablen C als Beispiel angefuhrt: 



(116) 



(N— K A — K b — K c — 1) (R 2 y(A BC)-R 2 y(AB)) ; 

K-c(l~Ry(ABC)) 



F a (K c ,N-K A — K b — K c -1) 



Bei beiden Vorgehensweisen werden zunachst nur vier Signifikanztests durch- 
gefuhrt, wodurch sich die Gesamt-lrrtumswahrscheinlichkeit nicht in dem 
MaRe wie bei der U ntermengen-, Vorwarts-, Ruckwarts- Oder Austausch- 
Methode erhoht. Wenn man es wunscht, konnen weitere Signifikanztests in 
Form von geschutzten Tests innerhalb der „signifikanten" Variablengruppen 
fur die einzelnen Variablen angeschlossen werden. Man kann dabei hoffen, 
daR die endgultige Variablenauswahl nicht in dem MaRe zufallsabhangig ist, 
wie dies bei den zuerst genannten Auswahlstrategien der Fall ist. Doch stehen 
zuverlassige Untersuchungen dazu noch aus. 



1.12 Teststarke 

Bisher haben wir im Zusammenhang mit der Prufung statistischer Flypothesen 
immer nur von der Wahrscheinlichkeit, einen Fehler 1. Art zu begehen, ge- 
sprochen. Beim Prufen statistischer Flypothesen konnen jedoch grundsatzlich 
zwei Fehlentscheidungen getroffen werden. Einmal kann eine tatsachlich rich- 
tige Flypothese aufgrund eines Tests verworfen werden, andererseits kann eine 
tatsachlich falsche Flypothese nicht verworfen werden. Solange man jedoch 
nur eine einzige Flypothese betrachtet, lassen sich nur Aussagen uber die 
Wahrscheinlichkeit des Fehlers 1. Art, das vorzugebende Signifikanzniveau a, 
machen. Dies ist auch in dem von Fisher ursprunglich konzipierten Signifi- 
kanztest die einzige bestimmende GroRe (vgl. Flaagen & Seifert, 1979, Kap. 9, 
insbesondere p. 198-199). Solange man jedoch nur eine einzige Flypothese 
pruft, lassen sich keine Aussagen uber die Wahrscheinlichkeit eines Fehlers 
2. Art machen, und damit auch keine Aussagen uber die „Gute" eines Tests, 
wenn man die Gute eines Tests durch die Wahrscheinlichkeit, richtig zu ent- 
scheiden, miRt. Zur Beurteilung der Gute eines Tests ist es also notwendig, 
neben der Nullhypothese auch die Alternativhypothese zu spezifizieren, wie 
dies auch im Rahmen der Neyman-Pearson-Testtheorie geschieht. Die Gute- 




